본문 바로가기
🗣️ 잡담

여러 AI 서비스 비교해 보기 (ChatGPT, Claude, Genimi, ClovaX)

by 개발자 진개미 2024. 8. 3.
반응형

AI 전쟁 두둥

 

평가에 중요한 요소?

일단 가장 중요한 건 당연히 성능입니다. 다른게 아무리 좋아도 AI가 멍청하면 솔직히 별로 쓰고 싶지가 않습니다. 하지만 의외로 성능만큼 중요한 게 서비스로서 얼마나 편리 한가였습니다. 즉, 편리성인데요. 이건 UI/UX를 포함한 다양한 기능들을 말하는 겁니다. 예를 들어 ChatGPT의 경우 여러 용도로 쓸 수 있는데요.

  • 웹 검색 하기
  • 이미지 생성하기
  • 다른 앱에 있는 정보들 복붙해서 물어보기

이 모든게 ChatGPT는 채팅에서 별 다른 동작 없이 물어보면 해 줍니다.

 

만약 웹을 검색하고 싶을 때는 웹을 켜야 하고 이미지를 생성하고 싶을 때는 다른 서비스를 써야 하고... 한다면 굉장히 불편하겠죠? 사실 AI 성능은 점점 높아지고 크게 차이가 없기 때문에 이런 편리함이 AI를 계속 쓰게 하는 요인이 되기도 합니다.


평가 대상

  • 일단 자체 AI Model을 개발한 서비스만 비교하겠습니다. 예를 들어 Perplexity는 비교적 유명하지만 자체 모델이 아닌 여러 AI 서비스를 조합해서 인터넷 검색을 하는 서비스이기 때문에 포함하지 않았습니다. 같은 이유로 뤼이드도 포함하지 않았습니다.
  • 한국에서 비교적 유명한 서비스 위주로 비교했습니다.

개인적인 평가

    성능 별점 서비스로서의 별점 가격, 사용 용량
Open AI Chat GPT ★★★★☆ (4 / 5) ★★★★★ (5 / 5) ★★★★★ (5 / 5)
Anthropic Claude ★★★★★ (5 / 5) ★☆☆☆☆ (1 / 5) ☆☆☆☆ (0 / 5)
Google Genimi ★★☆☆☆ (2 / 5) ★★★★☆ (4 / 5) ★★★★★ (5 / 5)
Naver Clova X ★☆☆☆☆ (1 / 5) ☆☆ (3 / 5) ★★★★☆ (4 / 5)

 

🐜 Open AI - Chat GPT

원조는 역시 다르긴 합니다. 최근의 성능은 Claude에 비해 떨어진다는 평가를 듣고, 저도 그렇게 느끼고 있긴 하지만 사실 차이가 그렇게 크지는 않습니다.

AI 모델만 잘 만드는게 아니라 편의성도 많이 신경 쓴다고 느꼈습니다. 처음에는 이미지를 만드는 모델을 dalle라고 따로 뒀었는데 현재는 ChatGPT에 통합돼서 채팅에 이미지를 생성해 달라는 요청을 하면 자동으로 dalle를 호출해서 생성해 줍니다. 마찬가지로 인터넷 검색도 새로운 서비스를 내는 게 아니라 ChatGPT에 통합시켜 최신 정보가 필요하다고 판단되면 자동으로 인터넷을 검색해 줍니다.

Mac 기준으로 전용 앱도 있는데 편의성이 나쁘지 않습니다. 가끔 버그가 있긴 한데 비교적 빠르게 고치는 편입니다.

OpenAI의 1가지 안 좋은 버릇은 과장 광고를 한다는 겁니다. Advanced Voice Mode는 발표되고 나서 거의 1년을 기다려서 나왔고, 나온 후에도 광고만큼 좋지 않았습니다. 비슷하게 ChatGPT 5도 나온다고, AGI 수준이라고 한지가 몇 년은 됐는데 아직 소식도 없습니다.

 

🐜 Anthropic - Claude

성능이 뛰어 나다고 해서 쓰기 시작했는데 확실히 좋긴 합니다. ChatGPT는 이상하게 대답하거나 풀지 못하는 문제를 여러 개 맞게 풀었습니다. 뿐만 아니라 추론능력이 ChatGPT에 비해서 뛰어나다고 느낀적이 여러 번 있습니다.

하지만 뭔가... 공대 감성이 심합니다. 미묘하게 계속 쓰기가 불편하고, 느리고... ChatGPT의 편의성을 따라간다고 느끼긴 하는데 어딘가 계속 부족합니다.

사실 저 같은 경우는 ChatGPT를 무거운 작업에 쓴다기보다는 검색의 대체용으로 쓰는 경우가 많기에 편의성이 상당히 중요해 현재는 Calude는 거의 쓰고 있지 않습니다.

 

🐜 Google - Gemini

구글도 AI를 만들었다고 해서 써 봤는데... 그냥 성능이 부족합니다. 헛소리를 하는 경우가 너무 많고 엉뚱한 대답을 많이 합니다. 가격도 ChatGPT랑 거의 비슷합니다. 구글 서비스에 편리하게 통합되거나 안드로이드의 Google Assitance에 통합되면 쓰기야 하겠지만 여러 AI 서비스 중에서 선택해야 한다고 굳이 쓸까 싶습니다.

 

🐜 Naver - Clova X

한국에서 AI 모델을 만들었다는 거 자체가 대단하긴 하지만... 서비스는 국적을 따지며 쓰지 않습니다. Naver ClovaX도 그냥 성능이 부족합니다. Gemini보다도 확실하게 추론 능력이 떨어지고, 헛소리 (Hallucination)을 하는 경우는 적지만 분량만 채우는 하나 마나 한 대답을 하는 경우가 많습니다.

한 가지 큰 장점은 한국 관련 정보는 기가 막히게 잘 준다는 겁니다. ChatGPT도 최근 많이 발전했지만 (특히 인터넷 검색 기능이 추가된 이후로) 아직까지는 ClovaX가 한국 관련 정보는 더 잘 안다는 느낌입니다. 실제로 제 ClovaX 채팅 기록도 한국 관련 정보를 물어본 경우가 많습니다.


결론

  • Anthropic의 Claude가 유명한 AI 중에서는 현재 가장 똑똑한 거 같다.
  • 하지만 그 차이가 크지는 않은데 사용하기가 힘들어서 (UI/UX, 모델이 너무 많음 등) ChatGPT를 주로 쓰게 된다.
  • 나머지도 각자의 강점이 있지만 솔직히 차이가 거의 없어서 거의 쓰지 않는다.

반응형