에세이
GPT-4o 파인튜닝(Fine-Tuning) vs. MyGPT 차이점 정리
목차
나는 업무에 자료조사 및 코드 작성 보조로 챗 지피티를 사용하고 있다.
통상적으로 챗지피티 웹/앱버전의 결과만해도 충분한 성능을 발휘하고 있어서 그럭저럭 사용하고 있었고, 이전에는 MyGPT를 직접 구성해서 좀 더 답변에 정확도를 올리는 방법을 사용하고 있었으나 요즘 추론모델이니 뭐니 새로 나온것들은 MyGPT가 지원이 안되어서 슬슬 유기하고 간단하게 쓰는 방식으로 사용하고 있었다.

그러는 와중에 어쩌다가 GPT-4o 파인튜닝(Fine-tuning)에 대해 알게 되었고 지난 24년 8월에 이미 GPT-4o 버전도 파인튜닝이 가능하게 지원되었다는 정보도 듣게 되었다.
일찍이 연구실에서 빅 데이터 학습모델 정제를 해본 경험으로써 파인 튜닝이 뭔지는 이론적으론 알고있었는데, 이게 지금 Open AI가 하는 서비스에서 어떤식으로 서비스가 구축이 되어있고 사용이 가능한지, 그리고 뭔가를 '개인화'하는 작업이 기존의 MyGPT랑 유사한듯 싶어서 나도 정리해볼겸 GPT-4o 파인튜닝(Fine-Tuning)과 MyGPT 차이점을 정리해보고 싶었다.
GPT-4o 파인튜닝(Fine-Tuning)과 MyGPT
우선 각자의 설명을 먼저 하고 가야할듯 싶다.
비슷하면서도 구현 원리가 전혀 다르기 때문에 이 둘을 시작부터 같은 선상에 놓고 비교하는건 좀 안맞다고 생각이 들기 때문이다.
파인튜닝(Fine-Tuning)
파인튜닝이란 어떠한 모델의 가중치(Weight)를 변경하여 특정 지식이나 로직이 편향(Bias)되도록 하는 작업이라고 볼 수 있다.
그냥 쉽게말해서 기본모델을 조금 다른 방식으로 재조립해서 다른 새로운 모델을 만들어 내는 작업이라 할 수 있다.
파인튜닝의 사용 예로는
- 법률, 의료, 금융 등 특정 전문지식을 AI가 학습하도록 훈련
- 고객 상담, 기술 지원 등의 일관된 응답 패턴을 유지해야하는 서비스
- 게임, 소설 등 특정 작품의 스타일을 반영한 생성기
등이 있다.
요는 특정 기능에 전문화된 모델로 최신 정보와 변화를 추구하기보다 정해진을 월등한 퀄리티로 해내는 전문가 시스템에 더 맞는 기법이다.
MyGPT (커스텀 GPT)
그에비해 MyGPT는 ChatGPT의 웹/앱에서 사용가능한 개인화된 설정이라고 보면 될것같다.
위에처럼 모델이니 훈련이니 거창한 기능이 아닌 '프롬프트'를 이용해서 AI에게 특정 대답을 유도하는 과정을 일련의 설정으로 제작해 배포하는 '서비스'임에 불과하다.
MyGPT의 사용 예로는
- 개인 비서 역할을 하는 AI
- 특정 문서를 분석하고 답변하는 AI
- 특정 유형의 글쓰기 스타일을 유지하는 AI
등 지식 기반의 서비스가 아닌 입력 데이터의 유형에 따른 '상식'적이고 '트렌드'가 가미된 미려한 출력을 내놓는데 그 기능이 특화되어있다.
결국 MyGPT는 '프롬프트'를 이용한 단순한 커스터마이징에 불과하고 AI를 학습시키는 개념은 아니지만, 반대로 최신 문서나 데이터를 찾아 응용해 답변을 내주는것이 가능하다.
파인튜닝 vs. MyGPT 비교
결국 이 둘을 비교하면 요청된 질문에 대한 답은 서로 어느정도 비슷할지 모르지만 그 내부 과정이 약간 다르다고 인지하면 될것 같다.


위 이미지 예시처럼 둘다 같은 원형 모델을 기반으로 사각형 모델을 만든다 칠때, 파인튜닝은 원형모델 자체를 사각형 모델로 변환하는 과정이라고 보면되고, MyGPT는 원형 모델은 유지하고 프롬프트를 이용해 사각형모델이 뱉는 답변처럼 '가공'한다고 보면 될것같다.
그리고 이런 부류의 과정에서 파인튜닝은 파인튜닝만의 특징이 강화되는것이고 MyGPT 또한 자신의 특징이 강화되는것이라고 이해하면 될것 같다.
기능 | GPT-4o 파인튜닝(Fine-Tuning) | MyGPT (커스텀 GPT) |
---|---|---|
이용 방법 | OpenAI API로만 모델 학습 및 사용 가능 | ChatGPT 웹/앱에서만 사용가능 |
모델 | 학습을 통해 모델 자체를 개선 | 주어진 모델만 사용가능 |
학습 방식 | JSONL 데이터셋 업로드 후 학습 | 프롬프트 기반 설정 |
추가 데이터 반영 | 최초 학습이후 변경 불가 | 지식 파일 제공 및 웹 검색으로 추가 가능 |
일관된 응답 | 항상 동일한 형식 유지 | 형식이 경우에 따라 변경될 수 있음 (불안정) |
비용 | 학습 비용 및 입/출력 토큰 비용 발생 | 무료 (ChatGPT Pro 필요) |
적합한 용도 | 지식 도메인 특화 AI, API 기반 서비스 | 개인 맞춤형 AI |
이둘에 대해 비교를 해보자면 위의 표로 정리가 가능할듯 싶다.
결론적으로 파인튜닝은 특정 스타일을 유지하고 이를 사용가능한 API 환경이 있을때 적합한 방식이고, MyGPT는 간단하게 개인화된 AI를 만들고 싶을때 적당한 방식이라 할 수 있다.
어떤 걸 선택해야 하나?
그럼 실제 상황에서 어떤 방식을 선택하는게 맞는지 몇가지 예를 들어 설명해보고자 한다.
목표 | 추천 솔루션 |
---|---|
특정 문체, 스타일 유지, 도메인 지식 학습이 필요할 때 | GPT-4o 파인튜닝 |
최신 데이터 반영, 실시간 파일 분석이 필요할 때 | MyGPT |
웹/앱에서 쉽게 AI를 사용하고 싶을 때 | MyGPT |
API 기반 서비스로 AI를 커스텀하고 싶을 때 | GPT-4o 파인튜닝 |
비용을 절감하고 싶을 때 | MyGPT |
특정 고객 대응 패턴을 유지해야하는 서비스를 운영해야할 때 | GPT-4o 파인튜닝 |
기업 내 특정 용어 및 업무 흐름을 반영해야할 때 | GPT-4o 파인튜닝 |
AI가 특정 지침을 지속적으로 따르게 하고싶을 때 | GPT-4o 파인튜닝 |
개인화된 챗봇을 만들어 사용하고 싶을 때 | MyGPT |
AI에게 질문, 내용정리, 글 요약, 초안 작성을 시키고 싶을 때 | MyGPT |
위 목표 예시의 내용을 간추려 보자면 결국 API, 스타일, 지식 학습은 GPT-4o 파인튜닝 방식을, 최신데이터 반영 및 간단한 AI 사용은 MyGPT 방식을 선택해 사용하는게 좋다고 정리할 수 있다.
결론
하지만 현실적으로 전문가가 아닌이상 GPT4o-파인튜닝을 하는 과정은 쉽지가 않은데 비해 MyGPT는 웹사이트에서 쉬운 UI/UX로 개인화 설정이 가능하므로 대부분의 경우에는 MyGPT를 이용하는게 훨씬 좋은 방법이라고 볼 수있다.
하지만 본인의 업무를 좀 더 전문화하거나 기업입장에서 AI를 사용한다고 생각한다면 파인튜닝 방식에 대해서도 적극적으로 이용해보는것도 서비스 품질 입장에서 좋은 선택이 될 수 있을 것이다.
대기업이나 자본이 있는 기업들은 자체적으로 AI 모델을 구축해 사용하지만, 일반인은 이러한 과정을 쉽게 따라하기 어렵다. 그러나 OpenAI API를 활용하면, 비교적 적은 비용으로도 개인이 직접 모델을 파인튜닝하여 사용할 수 있다는 점에서 큰 메리트가 있다고 본다.
물론 더 깊게 알아보자면 직접 모델을 다운받아 학습시켜 로컬모델을 만드는 방법도 찾아보면 있겠지만, OpenAI 덕분에 그런 마이너하고 딥한 기술이 표면상으로 올라왔다는거 자체가 의미있는 일이라고도 본다.
끝!
#AI
0
개의 댓글
에세이 카테고리의 다른 글

02/17
COF-999: 이산화탄소 포집 기술의 게임 체인저
빈둥거리는 시간에 유튜브 숏츠를 보다가 이산화탄소 포집의 신물질이자 관련 산업의 게임 체인저가 될만한 물질인 COF-999가 나...

02/07
딥시크(DeepSeek) 쇼크의 국제 동향 분석
최근 국내외에서 "딥시크(DeepSeek) 쇼크"가 큰 이슈로 떠오르면서, 특히 국내에서는 중극으로의 정보 유출을 우려해 정부기관과...

02/03
딥시크(DeepSeek) R1 모델 로컬 실행 후기
요즘 딥시크라고 중국에서 만든 오픈소스 AI에 대해서 말이 많다.특히나 다른 AI 서비스와 다르게 오픈소스 모델로 직접 로컬 컴...