스마트폰활용

기계학습 없이 독학하는 인공지능, 알파 제로

알파제로.jpg

인간과 바둑 대결에서 4 대 1로 완승한 알파고. 여기에 이어 학습 없이 독학하는 

‘알파 제로’는 똑똑하다 못해 인간 사회가 직면한 에너지 절감과 

신물질 개발 등의 문제를 해결하는 데 기대를 모으고 있다. 

 

과학 전문지 《네이처》 에서는 ‘인간의 지식 없이 바둑 정복하기’라는 제목으로 알파고의 후속 버전 알파 제로를 소개했다. 알파 제로는 구글 딥마인드가 새로 내놓은 인공지능으로 별다른 학습 없이 스스로 깨우쳐 알파고를 뛰어넘었다. 기존의 알파고 출현으로 딥러닝과 강화학습을 탑재한 인공지능 알고리즘에 대해서는 익히 들어왔던 터. 하지만 알파 제로의 성능에 대해서는 주목하지 않을 수 없다. 바둑판 위에 검은 돌, 흰 돌 두는 방법만 알려줬을 뿐임에도 알파 제로는 알파고와의 대국 100판에서 완승했기 때문이다. 그로부터 40일 뒤 알파고 마스터와의 대국에서 알파 제로는 89승 11패를 기록했다. 알파고가 사람이 둔 바둑 기보를 보고 학습한 다음 빠른 연산 속도를 이용해 사람을 뛰어넘었다면 알파 제로는 셀프대국을 치르면서 바둑을 학습하고 분석한 것이다. 

 

알파 제로의 알고리즘은?

 

알파 제로 알고리즘은 신경망 예측 향상과 몬테카를로 트리 탐색으로 강화했다. 게임을 하면 할수록 실력이 커져가는 것이다. 바둑 기보 하나 보지 않고 셀프대국만 치르면서도 알파고와 알파고 마스터를 너끈히 물리칠 수 있는 저력이 바로 여기에 있었다. 알파 제로는 4세대 TRU와 44개의 CPU 코어를 입었다. 인간 두뇌의 신경망과 흡사하다. 이로 인해 시간이 흐르면서 학습 속도가 증가했다. 그 덕분에 알파 제로는 학습 4시간 만에 체스 인공지능 챔피언인 스톡피시를 이겼다. 이세돌 9단을 이긴 알파고의 성능을 넘는 데 30시간 걸렸다. 빅데이터 없이 스스로 학습하는 알파 제로. 셀프 게임을 하며 최적화한 시간은 체스의 경우 9시간, 쇼기는 12시간, 바둑은 13일 걸렸다. 구글 딥마인드의 데미스 허사비스 CEO는 알파 제로에 대해 “제로 상태에서 시작해 셀프 대국을 하다가 보다 나은 게임을 학습했고 그 덕분에 독특한 스타일을 선보였다”고 전했다. 

 

알파 제로와 기존 인공지능과의 차이 

 

바둑 인공지능 전문가 감동근 아주대 전자공학과 교수는 한 방송과의 인터뷰에서 알파 제로 이전 버전과 알파 제로 간의 차이점을 이야기했다. 첫 번째는 신경망 통합이다. 알파 제로 이전 버전은 정책망과 가치망이라는 2개의 신경망으로 되어 있지만, 알파 제로는 이 두 가지를 하나의 네트워크로 구현했다는 것이다. 두 번째는 무에서 유로의 학습이다. 알파 제로 이전의 알파고에서는 15만 건의 기보에서 3,000만 개의 수를 학습했다. 이와 달리 알파 제로는 바둑 규칙만을 갖고 셀프대국을 통해 바둑의 이치를 스스로 터득해나갔다. 세 번째는 강화 학습과 평가다. 알파 제로는 학습한지 몇 시간 만에 이전 알파고 버전과 인간을 능가했다. 

 

알파 제로의 확장성은?

 

체스, 쇼기, 바둑 등 여러 게임에서 승리한 알파 제로의 확장성은 있을까? 구글 딥마인드는 초기 단계이기는 하지만 알파 제로의 창의성은 단백질 구조 연구나 에너지 절감, 신물질 개발과 같은 문제를 해결하는 데 비약적인 발전을 이룰 수 있을 것이라고 공식 블로그를 통해 밝혔다. 구글 데이터센터의 에너지 소비량을 40%까지 줄인 사례가 대표적이다. 센터 내 수천 개의 센서에서 온도와 전력량, 냉각펌프 운영속도, 각종 설정값 등 인공신경망에 학습시킨 덕분이다. 로보틱스 분야에서도 활용 가능할 것으로 점쳐진다. 일본 히타치(HITACHI) 사가 올린 로봇 영상을 보면 딥러닝과 강화학습으로 그네 타는 동작을 수 없이 반복 학습한 로봇이 그네를 사람보다 훨씬 높이 잘 타는 모습을 보여주고 있다. 

 

 

배너
배너

발행인의 글


"공직자 ‘권력’과 ‘봉사’는 같은 말...시민 목소리 늘 경청" [유정복 대한민국시도지사협의회 회장 겸 인천광역시장]

인터뷰는 개헌 얘기가 강을 이루며 민주주의의 바다에 이르렀다. 난파당하지 않고 견고한 몸으로 정박한 목선 유정복은 강인했다. 아니 처절했다. 공직생활을 꿰뚫는 봉사 정신은 권력에 대한 ‘지론’이었고 시민 국민과의 대화로 몸에 밴 ‘낮은 눈높이’는 권력을 쓰는 ‘정도’로 설명됐다. 달변이 아니어서 ‘선동’에 능하지 않고 제스처는 화려하지 않아 ‘분신술’과 거리가 멀다. 대한민국 시도지사협의회장으로서 더 큰 권력은 ‘지방분권’ 실현이었고 인천광역시장으로서 진정한 권력은 ‘시민 배부른 행복’ 쟁취였다. 시도지사협의회장으로서 지방분권 ‘완전’ 정복은 지역 경쟁력 강화로 이루어질 것이다. 개헌으로 인사 재정 조직의 권한을 중앙에서 넘겨받고 헌법 전문에 지방자치 실시를 못 박아야만 전체 국가 발전에 도움이 된다고 목소리를 높인다. 대통령의 결단만 남았다. 전국에 메아리치는 지방자치 숙원민의가 가장 큰 원군이다. 인천의 성공 사례는 저평가된 것 같아 낯설다. 저출생을 뚫은 아이 플러스 드림 정책 시리즈나 부쩍 자란 지역경제는 전국구 모범사례다. 그러나 저출생 타개를 위해 인구 부처 신설안을 국회에 냈으나 ‘권력’에 막혀있다. 좋은 일

"산업 간 격차 해소 입법, 사회 통합의 정치 실현" [어기구 국회 농림축산식품해양수산위원장]

먹고사는 문제가 가장 절실해진 시대, 그 해답을 진심으로 고민하는 정치인이 있다. 바로 어기구 국회의원이다. 농림·축산·식품·해양수산을 아우르는 농해수위원장으로서 그는, 국민의 먹거리와 국토를 지키는 최전선에 서 있다. 하루에도 서너 건 이상의 민원과 간담회를 소화하며, 때로는 법안 발의로, 때로는 정부 부처를 설득하는 끈질긴 노력으로 지역과 나라를 동시에 돌보고 있다. 하지만 어 의원이 주목받아야 하는 이유는 단순한 ‘성실함’만이 아니다. 경제 펀더멘탈 붕괴를 경고하며 지금의 저성장 고착화를 막기 위해 ‘경제의 인공호흡’을 주장하는 목소리는, 정치권 안팎에 진중한 울림을 준다. 또한 사회 양극화 해소를 한국 사회의 가장 시급한 과제로 꼽으며, 지역균형 발전과 사회통합을 향한 구체적 해법을 제시하는 그는, 단순한 선심성 발언이 아니라 구조적 대안을 이야기하는 보기 드문 현실주의자다. 특히 고향 당진에서는 철강산업 보호, 농공단지 활성화, 해경 인재개발원 유치 등 지역 생존 문제를 풀어내기 위해 누구보다 치열하게 뛰고 있다. 작은 민생부터 거대한 국가 아젠다까지, 문제를 정확히 짚고 해법을 준비하는 사람. 지금 우리가 어기구를 주목해야

호주 노동委 “보육교사 등 50만명 임금 최대 35% 올려라”

호주 공정노동위원회(Fair Work Commission, FWC)는 여성 근로자들이 다수를 차지하는 직종에 대해 최대 35%의 임금 인상을 권고했다. 이 조치는 약 50만 명의 근로자에게 영향을 미치며, 특히 유아교육, 사회복지, 보건 및 약사 등 전통적으로 여성 비율이 높은 직군이 대상이다. 4월 발표되 이 권고는 단순한 임금 조정이 아닌 성평등 실현을 위한 역사적 전환점으로 평가되고 있다. 호주는 OECD 국가 중에서도 성별 임금 격차가 비교적 적은 국가 중 하나로 알려져 있으나, 여성 중심 직종에서의 ‘구조적 저평가’ 문제는 여전히 남아 있었다. 2023년 기준, 호주의 성별 임금 격차는 13.3%였으며, 이는 여성들이 남성과 같은 일을 하더라도 연간 약 13,200 호주 달러(약 1,170만 원) 적은 수입을 가져간다는 의미다. FWC는 이러한 구조적 격차가 여성 다수가 종사하는 돌봄·복지 직종의 사회적 가치가 임금에 충분히 반영되지 않았기 때문이라고 보고, 성중립적 평가 대신 ‘성인지적 가치 평가’를 적용한 최초의 판결을 내렸다. 여성 중심 산업의 임금 인상 배경 이번 결정은 2022년 알바니지(Albanese) 정부가 도입한 ‘공정노동법(Fair