구글 AI 모드, 무료 AI 도구 중 가장 높은 정확도 기록…챗GPT는 2위 차지

홈 > 투자정보 > 해외뉴스
해외뉴스

구글 AI 모드, 무료 AI 도구 중 가장 높은 정확도 기록…챗GPT는 2위 차지

코인개미 0 17
13da94e7d7acb325289d936dda349a37_1751507099_0446.png


최근 발표된 AI 검색 도구의 정확도 테스트에서 구글의 'AI 모드'가 가장 높은 점수를 기록하며 1위를 차지했다. 이 테스트는 미국 워싱턴포스트(WP)가 공공 및 대학 도서관 사서들과 협력하여 진행한 것으로, 총 9개의 주요 AI 도구를 대상으로 하였다. 구글 AI 모드는 웹에서 정보를 심도 있게 검색하고 다양한 출처를 종합하여 답변을 제공하는 기능으로 인정받았다.

이번 테스트에서는 구글 AI 모드와 AI 오버뷰, 챗GPT(오픈AI), 클로드(앤스로픽), 메타 AI, 그록(xAI), 퍼플렉시티, 빙 코파일럿(마이크로소프트)을 포함한 다양한 AI 도구가 평가되었다. 특히 챗GPT는 GPT-5와 GPT-4 터보 모델을 모두 포함하여 분석되었다. 연구진은 총 30개의 질문을 제시한 뒤 AI가 제공한 900건의 답변을 점수화하였으며, 질문은 퀴즈, 전문 자료 검색, 최근 사건, 내재된 편향, 이미지 인식 등 5가지 카테고리로 나뉘었다.

최종 결과에서 구글 AI 모드는 100점 만점에 60.2점을 기록하며 1위를 차지했고, 챗GPT는 55.1점으로 2위에 올랐다. 그에 따라 퍼플렉시티가 51.3점으로 3위를 기록했으며, 그록3는 40.1점으로 8위, 메타 AI는 33.7점으로 9위를 차지하였다. 특히, 구글 AI 모드는 퀴즈와 최신 사건 부문에서 가장 정확한 답변을 제공한 것으로 평가되었다. 또한, 전문가 출처 검색에서는 빙 코파일럿이 우위를 보였으며, 이미지 인식에서는 퍼플렉시티가 가장 높은 점수를 기록하였다.

이러한 테스트 결과는 AI 도구들이 정보 확인과 최신성 검증에 있어 여전히 한계를 가지고 있음을 지적하고 있다. 특히, AI는 자신 있게 잘못된 답변을 제시하는 '할루시네이션' 현상으로 알려진 문제를 여러 차례 보여주었다. 따라서 WP는 AI의 답변을 맹신하기보다 출처 확인, 최신성 검증, 비판적 사고를 통해 검토해야 한다는 교훈을 강조하였다.

이번 결과는 이용자들이 AI 도구를 활용할 때 신중함을 기해야 함을 보여주며, 기술의 한계와 발전 가능성을 동시에 반영하고 있다. AI 기술이 진화하는 과정에서, 신뢰할 수 있는 답변을 제공할 수 있는 방법에 대한 노력이 계속 필요할 것이다.

media&token=5baaac21-924f-4e81-9cd5-b5c12c622e77
0 Comments

공지사항


광고제휴문의