레플리
글 수 497


 

https://news.naver.com/main/read.nhn?mode=LSD&mid=sec&sid1=102&oid=005&aid=0001369774

 

 

 

"실습 훈련 나흘째였던 9월 14일, 11장짜리 과학 논문을 데이터로 편집하는 동안 띄어쓰기 오류 194개를 발견했다. PDF 형태의 논문을 HTML 데이터로 바꾸는 과정에서 피할 수 없는 일이었다. 교육시간에 강사는 “데이터에 오탈자가 있으면 AI가 올바르게 학습할 수 없다”고 말했다. AI의 작동을 위해 잘못된 띄어쓰기를 일일이 이어붙이는 게 기자와 같은 ‘데이터 구축자’의 일이었다."

 

디지털 뉴딜 사업의 일환으로 KISTI에서 데이터 구축 업무를 진행 중입니다. 기자가 직접 참여를 하여 그 과정을 자세히 보여주고 있습니다. 역시 학습 데이터를 만드는게 쉽지 않은 것 같습니다.

 

엮인글 :
List of Articles
제목 글쓴이 날짜 조회 수
日 AI, 200점 만점 대입서 185점…내년 도쿄대 입학 노린다 깊은바다 2020-11-11 180
김주하 앵커와 AI 아바타 앵커와의 첫 대면 깊은바다 2020-11-10 225
제프리 힌튼 인터뷰 '딥러닝으로 인간 이성 구현 가능할 것' 깊은바다 2020-11-07 212
인공지능 컨설팅 스타트업인 업스테이지 김성훈 대표 인터뷰 깊은바다 2020-10-27 1552
속삭여도 OK...카카오, 새 스마트스피커 '미니헥사' 출시 깊은바다 2020-10-26 173
AI전문가 '딥 페이크, 해결책 없다' 깊은바다 2020-10-24 216
드라마 '스타트업'에 중요한 역할로 등장한 AI 스피커 깊은바다 2020-10-21 407
MS, '자동 이미지 캡션' 고도화 - Seeing AI 깊은바다 2020-10-19 143
애플, 스마트홈 시장 노린 스피커 '홈팟 미니' 공개 깊은바다 2020-10-15 169
'내가 로봇의 비서라니…' 인간 노동이 일구는 AI 깊은바다 2020-10-14 172
SK텔레콤, 'T전화' AI 접목시킨 'T전화x누구' 서비스 선봬 깊은바다 2020-10-13 232
AI챗봇 일상의 시대, 진화의 끝은? 깊은바다 2020-10-10 149
모든 단과대에 'AI 융합과목'…숭실대 AI 비전선포식 개최 깊은바다 2020-10-07 172
소비자 삶으로 들어온 LG 로봇…추격 속도내는 삼성 깊은바다 2020-10-06 179
AI 챗봇 아직은 일렀나… 유통업계 챗봇 서비스 속속 종료 깊은바다 2020-10-03 249