본문 바로가기
망각을위한노트

오픈소스 챗봇 솔루션, OpenChatKit 장점, 단점, 번역 요약

by RNE21 2023. 3. 14.
반응형

ChatGPT 가 촉발한 챗봇 대한 관심은 아직도 그 열기가 식지 않았습니다.

오늘은 오픈소스 ChatBot 솔루션, OpenChatKit 소식을 가져와 봤습니다.
이 글은, OpenChatKit 공식 홈페이지 내용을 번역 요약한 글입니다.


OpenChatKit, 누가 언제 만들었어?

OpenChatKit은 3월 10일에 발표된, 오픈소스기반 ChatBot 생성 솔루션 입니다.
OpenChatKit을 만든 곳은 Together 입니다.


OpenChatKit의 라이센스는?

OpenChatKit 은 Apache-2.0 라이센스를 따르고 있습니다.


OpenChatKit의 HELM 벤치마크 결과는 ?

아래는, HELM 벤치마크 결과 그래프입니다.

HELM 벤치마크 - 출처 : OpenChatKit 홈페이지

 


어디로 가면 사용해 볼 수 있어?

아쉽게도 지금은 closed beta 기간이라, 사용해볼 수는 없습니다 :(
베타테스트 기간이 끝나면 곧 open 될 거라 봅니다.

일단 URL을 여기 적어두고요, 베타테스트 끝나면 다시 소식을 전하겠습니다!
https://huggingface.co/spaces/togethercomputer/OpenChatKit


OpenChatKit은 뭘 잘하지?

  1. 긴 문장을 잘 요약할 수 있습니다.
  2. 비정형 문장에서, 정형 데이터를 추출할 수 있습니다. 데이터베이스화 하기 좋겠군요.

OpenChatKit의 단점은 ?

  1. 잘못된 답변을 할 가능성이 항상 존재합니다. 챗봇들의 공통적인 단점이죠. 
  2. OpenChatKit은 아직 프로그래밍 code를 대규모로 학습하지는 못했습니다. 코드를 작성하거나 변환하거나 제안하는 능력은 아직 제한적입니다.
  3. 때때로 같은 응답을 반복합니다.
  4. 대화 도중에 대화 주제를 변경해도, 챗봇이 이전 주제에 관해서 계속 얘기하기도 합니다.
  5. 창의적인 글쓰기를 길게 하지는 못합니다.

모델을 어떻게 개선할 수 있어?

사용자지정 모델을 만들 수 있게 도구를 제공하고 있는데요. 이걸로 특정 도메인에 최적화할 수 있습니다.

  1. 먼저, 지정된 형식의 상호작용의 데이터 세트를 준비합니다.
  2. 데이터세트를 json파일로 저장하고, 채팅 모델을 미세 조정 합니다.
  3. 필요할 경우, moderation data를 준비하고, moderation model을 튜닝합니다.

(ChatGPT는 최신 정보는 모르던데,) OpenChatKit은 최신 정보도 제공할 수 있어?

질문에 대한 관련 정보를 Web에서 검색하게 설정하면, 최신 정보를 활용하여 답변하게 할 수 있습니다.
예제로, Wikipedia를 활용해서 답변하게 하는 script를 제공하고 있습니다.


부적절한 콘텐츠는 어떻게 제외하지 ?

moderation model을 통해, 입력을 제한할 수 있습니다.


오픈소스 커뮤니티에 기여하는 방법은 ?

  1. data set을 제공하는 방법
  2. 피드백 리포팅하기
  3. Hugging Face에서 제공되는 앱을 사용하여, 피드백 제공. 부적절한 응답 표시해 주기.

OpenChatKit에 대해서 간단하게 알아봤습니다. 우리나라에서도 오픈소스 기여자가 많이 나오면 좋겠군요. :)

EOF

반응형