'빅데이터서비스플랫폼' 구축…공공데이터, 자연어로 검색‧답변
[서울=뉴스핌] 이진용 기자= # '서울시 지역별 산업변화'에 대한 논문을 준비하고 있는 A씨는 자치구별 산업활동에 대한 자료를 조사하기 위해 자료를 검색하던 중 '서울시 열린데이터광장'에서 자치구별 지역내총생산(GRDP) 데이터를 확보할 수 있다는 사실을 알게 됐다. 그러나 해당 포털에서 검색되는 자료가 너무 방대해 어떤 자료를 봐야 할지 알 수 없었고 통계와 분석 자료도 복잡해 이해하기 어려워 자료를 활용하는 데 애를 먹었다.
"서울에서 금요일 저녁, 가장 붐비는 지하철역 상위 5개를 알려줘", "서울에 사는 외국인의 행복지수는?", "자치구별 지역내총생산 규모를 알고 싶어" 등 내년부터 서울시가 보유하고 있는 방대한 공공 데이터를 질문형으로 검색, 답변받는 서비스를 이용할 수 있게 된다.
서울시는 지자체 최초 초거대AI(언어모델) 기반 대시민 검색서비스를 선보이기 위한 '빅데이터서비스플랫폼 구축'에 들어간다고 28일 밝혔다. 검색서비스가 구축되면 데이터 전문가가 아닌 서울시민 누구나 공공 데이터를 쉽게 찾고 생활에 활용할 수 있게 된다.
이에 따라 기존에 시가 제공해 온 API(인터페이스) 중심의 데이터 서비스에서 나아가 앞으로는 AI 챗봇을 활용한 '자연어 검색'으로 데이터를 쉽게 요구하고 그래프․차트 형태로 시각화된 통계 및 분석 자료를 받아볼 수 있게 된다.
시가 구축할 '빅데이터서비스플랫폼' 서비스는 한국어에 특화된 초거대AI를 활용해 자연스러운 검색과 답변을 제공한다. 시민들은 일상 생활 속 궁금증부터 고급 데이터 분석까지, 자연어로 질문하고 원하는 정보를 쉽게 얻을 수 있다.
예컨대 "남산 근처 주차장 위치를 알려줘"와 같은 질문에는 서울시 공식 홈페이지 내 주차장 정보를 편집해 안내하고 "남산에 편의시설은 어떤 게 있지?"와 같이 연계된 추가 질문도 가능해 정보를 빠르게 종합해 안내받을 수 있다.
또 "서울에 사는 외국인의 행복지수는 어떻게 되지?", "자치구별 지역내총생산 규모를 알려줘"와 같이 서울서베이, 서울 지역내총생산 등 통계치 기반 정보나 "강서구 전년 대비 지역내총생산 성장률과 1인당 규모는 얼마인가?"와 같은 복합 질문도 가능하다.
"환경차 보급확산 추세에 맞춰 서울 시내 전기차 관련 데이터를 찾아줘"와 같이 요청하면 서울시가 보유한 데이터 중 '전기차' 키워드를 포함한 대기환경 정보, 온실가스 배출량 등 관련된 데이터를 모두 모아 분석에 활용할 수 있게끔 제공할 예정이다.
답변은 그동안 서울시에 쌓인 공공 데이터, 통계·인구·교통·물류 등 '도시 빅데이터'를 기반으로 제공되며, 외부 데이터가 필요한 경우 검색 방법까지도 상세하게 제공하는 등 '자연어 검색'에 최적화된 서비스로 제공할 계획이다.
아울러 서울시는 시민에게 필요한 행정 또는 민간 데이터 검색 외에도 데이터 분류체계·데이터 간 연관관계 등을 시각화한 '데이터 맵' 주제별 데이터 분석 결과를 인포그래픽 형태로 제공하는 '주제 시각화' 서비스도 함께 제공할 예정이다.
한편 시는 초거대 AI 기반 검색서비스 구현을 위해서는 빅데이터 수집과 분석 역량이 중요한 만큼 공공클라우드를 도입하고 서울시 직원 대상 AI 분석 교육을 진행, 데이터 분석 역량도 강화해 나간다.
어린이도 쉽게 이해할 수 있는 자료를 제공하기 위해 3차원 가상 융합관을 조성, 공공 데이터에 대한 접근성과 흥미도 높인다.
윤충식 서울시 빅데이터담당관은 "경제·산업·문화 등 모든 분야에 폭넓게 확산되고 있는 '대화형 AI'를 활용해 공공데이터 가치와 사용성을 높이기 위해 새로운 검색서비스 플랫폼을 구축하게 됐다"며 "시민이 방대한 공공데이터에 편리하게 접근하고 사용할 수 있도록 앞으로도 데이터 기반 행정 강화를 위한 노력을 지속할 것"이라고 말했다.
jycafe@newspim.com