기후위기시계
실시간 뉴스
  • KAIST 개발 ‘한국형 AI’ 세계 2위…첫 ‘LG 글로벌 AI 챌린지’ 성료
18일(현지시간) 캐나다 밴쿠버 컨벤션센터에서 열린 워크숍 ‘NICE(New Frontiers for Zero-shot Workshop)’에서 ‘LG 글로벌 AI 챌린지’에서 2위를 차지한 오영택 KAIST 연구원(왼쪽에서 3번째) 등 연구팀이 이경무 서울대 석좌교수(왼쪽에서 4번째)와 기념사진을 찍고 있다. [LG 제공] 8일(현지시간) 캐나다 밴쿠버 컨벤션센터에서 열린 워크숍 ‘NICE(New Frontiers for Zero-shot Workshop)’가 끝난 뒤 참가자들이 포즈를 취했다.[LG 제공]

[밴쿠버=한국과학기자협회 공동취재단] 18일(현지시간) LG AI연구원과 서울대 AI대학원, 셔터스톡 주관으로 캐나다 밴쿠버 컨벤션 센터에서 워크숍 ‘NICE(New Frontiers for Zero-shot Workshop)’가 열렸다. LG AI연구원이 세계 최대 컴퓨터 비전 학회 ‘CVPR(Computer Vision and Pattern Recognition, 컴퓨터 비전 및 패턴 인식)’을 앞두고 개최한 첫 워크숍이다. 국제전기전자공학회(IEEE)가 개최하는 ‘CVPR’에서 워크숍은 연구 분야 성숙도가 일정 수준 이상 될 때까지 수년~수십년간 이어가는 경우가 많은 만큼 이번 워크숍을 시작으로 LG AI연구원은 이미지 캡셔닝 분야 연구를 주도해 나간다는 방침이다.

이날 워크숍 주제는 ‘제로샷 이미지 캡셔닝’이다. 이미지 캡셔닝은 인공지능(AI)이 이미지를 구성하고 있는 객체들과 관계를 인식해 자연어로 설명하는 것을 말한다. 고품질 이미지와 텍스트 데이터를 상당량 학습시켜 구성한 초거대 AI모델로 캡셔닝 정확도를 높이는 동시에 학습한 적 없는 이미지(제로샷 이미지)도 스스로 캡션을 만드는 생성형 AI모델을 개발하는 게 제로샷 이미지 캡셔닝이다. 컴퓨터가 사람처럼 이미지나 영상을 읽어내는 것을 의미한다.

이날 워크숍에서는 ‘제로샷 이미지 캡셔닝’을 주제로 올해 2월부터 4월까지 진행된 ‘LG 글로벌 AI 챌린지’에서 2위를 차지한 KAIST 연구팀의 오영택 전기및전자공학부 연구원(박사과정)의 수상자 발표가 진행됐다. 올해 처음으로 개최한 이번 챌린지에 전세계 총 142개 연구팀이 참여한 가운데 중국 난징과기대 연구팀과 한국 KAIST 연구팀이 각각 1, 2위를 차지했다.

오 연구원은 “LG AI연구원이 첫 진행한 ‘LG 글로벌 AI 챌린지’에서 인공지능이 기존 이미지 데이터를 참조할 때 부하가 걸리지 않도록 최적화하는 데 초점을 맞춰 좋은 결과를 낼 수 있었다”며 “최근 이미지를 보고 이를 글로 묘사하는 ‘비전 인식’ 분야에 관심이 집중되고 있다”고 강조했다. 오 연구원은 내년 챌린지 경쟁은 더욱 어려울 것으로 예상되지만 좋은 아이디어가 떠오르면 내년에도 참가할 계획이다. 난징과기대 연구진은 이미지 캡셔닝 AI모델의 이미지 이해력을 높이기 위해 유사한 내용을 담고 있는 참조 데이터를 대규모 학습시켜 AI 모델의 정확도에서 가장 높은 점수를 얻어 우승을 차지했다.

LG 글로벌 AI 챌린지를 진행하기 위해 대회 공동 주관사인 셔터스톡은 저작권 문제 없이 사용할 수 있는 고품질 데이터셋 2만6000개를 무료로 제공했다. 이중 73%는 사람이 포함된 이미지로 구성됐다.

워크숍에서 챌린지 주관사로 발표에 나선 알레산드라 살라(Alessandra Sala) 셔터스톡 AI·데이터사이언스 총괄책임자(디렉터)는 “AI모델을 만들 때 가장 중요한 것은 데이터를 수집하고 고품질화하는 작업”이라며 “이미지 캡셔닝 AI모델에는 편견과 고정관념을 배제하고 다양성·형평성·포용성을 가지도록 해야 한다”고 설명했다.

김승환 LG AI연구원 비전랩장(상무)은 “이번 챌린지를 통해 연구자들이 이미지 캡셔닝에 대한 큰 관심을 가지고 있음을 볼 수 있었다”며 내년 CVPR에서도 챌린지와 워크숍을 이어갈 계획이라고 밝혔다. 그는 이번 챌린지에 대해 “참조 데이터셋을 제공하다 보니 데이터를 학습해 정확도를 높인 팀들이 고득점을 받은 경향성이 보이기도 했다”며 이를 고려하고 또 캡셔닝 성능 평가를 명확히 하기 위한 새로운 방식도 도입할 예정이라고 설명했다.

김 랩장은 “올해는 일반 이미지를 주로 썼다면 내년엔 다양한 분야에 활용되는 이미지 등 실제로 활용할 수 있는 형태까지 확장하겠다”며 “이미지 이해 연구에서 연구원의 리더십을 확장해 나갈 것”이라고 말했다. 한편 이번 첫 챌린지에서 한국의 카카오브레인과 우리은행 연구팀이 3, 4위를 각각 차지했다.

nbgkoo@heraldcorp.com

맞춤 정보
    당신을 위한 추천 정보
      많이 본 정보
      오늘의 인기정보
        이슈 & 토픽
          비즈 링크