RTX4080S 에서동작시킬만한 local LLM model 성능에 대한 주관적 비교

### Ollama를 활용한 로컬 LLM 모델 테스트 정리

Ollama를 사용하여 다양한 LLM(Local Language Model)을 테스트한 결과를 두 가지 주요 관점에서 평가할 수 있었습니다:

1. **한국어 처리 성능의 한계**: 대부분의 모델이 한국어를 제대로 처리하지 못하거나, 일부 깨짐 현상이 발생했습니다.

2. **지연 시간(Latency)**: 모델 응답 속도가 느려 실사용에 어려움이 있었습니다.

### 테스트 환경

- **PC 사양**: Intel i7, DDR 32GB, RTX 4080S (12GB VRAM)

- **제약 사항**: Llama 3.3 70B 모델은 VRAM 부족으로 로딩 불가.

### 모델별 평가 결과

#MODEL_NAME = "llama3.2" 한국어가 일부 깨짐
#MODEL_NAME = "EEVE-Korean-10.8B"
#MODEL_NAME = "llama3-instruct-8b" 한국어로 대답하지 못함함
#MODEL_NAME = "llama3.3:70b-instruct-q2_K" 너무 느림
#MODEL_NAME = "phi3:medium" 성능이 나쁨
#MODEL_NAME = "gemma2:27b" 많이 느리나 챗GPT 같음
MODEL_NAME = "gemma2" # 빠름

### 결론

- 한국어 처리가 중요한 경우, 현재 Ollama 기반 LLM은 한계가 있습니다.

- 고성능 모델은 지연 시간이 길거나 메모리 한계로 인해 로딩이 어려운 경우가 많습니다.

- 빠른 응답 속도를 원한다면 Gemma2와 같은 경량 모델이 적합하지만, 성능은 제한적일 수 있습니다.

일단 EEVE-Korean-10.8B 와 gemma2 를 번갈아가면서 써보려고 합니다.

참고할 내용들

Citations:

[1] https://www.youtube.com/watch?v=GsZ9w04smVE

[2] https://codingopera.tistory.com/77

[3] https://www.gpters.org/dev/post/ollamareul-iyonghan-hangeulpan-rokeol-llm-74iRcn2ODbKSbMF

[4] https://www.youtube.com/watch?v=mmTgOHYnKR0

[5] https://fornewchallenge.tistory.com/entry/%EC%95%BC%EB%86%80%EC%9E%90-%ED%95%9C%EA%B5%AD%EC%96%B4-%EC%96%B8%EC%96%B4-%EB%AA%A8%EB%8D%B8-EEVE%EC%99%80-Ollama%EB%A1%9C-%EA%B5%AC%ED%98%84%ED%95%98%EB%8A%94-%EB%A1%9C%EC%BB%AC-RAG

[6] https://www.youtube.com/watch?v=ILqsZI0PnyE

[7] https://benant.wordpress.com/2024/04/22/llama-3-%ED%95%9C%EA%B5%AD%EC%96%B4-%EC%84%B1%EB%8A%A5%EC%9D%80/

[8] https://www.inflearn.com/community/questions/1409677/ollama%EB%A1%9C-%EC%82%AC%EC%9A%A9%EA%B0%80%EB%8A%A5%ED%95%9C-%ED%95%9C%EA%B8%80-%EC%9E%84%EB%B2%A0%EB%94%A9-llm-%EB%AA%A8%EB%8D%B8-%EC%B6%94%EC%B2%9C

[9] https://hyunicecream.tistory.com/121

이 블로그의 인기 게시물

llama 계열 gguf 제공되는 경우 가져와서 사용하는 예제

llama 계열의 모델이 친절하게 gguf 형태로 제공되는 경우 어떻게 다운받고 어떻게 ollama에 추가하는지 예전에 gguf 파일을 등록하는 유튜브 강의를 보고 메모해두것을 기반으로 2024년 12월31일 추운 겨울 밤 기억을 백업해 봅니다 수동으로 작성한 것은 지우고 copilot으로 포맷을 정리해서 업데이트합니다. Bllossom/llama-3.2-Korean-Bllossom-3B-gguf-Q4_K_M 한국어 모델 추가하기 시작 : MS Copilot과의 질의응답 중 llama 3.2 기반의 한국어 학습 모델을 발견. 현재 사용 모델 : EEVE-Korean-10.8B (약 7.7 GB) 모델 사용 중. llama 3.2 기반 한국어 모델 소개 : 모델 설명 링크 gguf 파일 다운로드 링크 deepseek-ai/DeepSeek-R1-Distill-Qwen-7B 기반 한국어 모델 소개 : 모델 설명 링크 gguf 파일 다운로드 링크 모델 설정 파일 (Modelfile) : FROM llama-3.2-Korean-Bllossom-3B-gguf-Q4_K_M.gguf PARAMETER temperature 0.6 PARAMETER top_p 0.9 TEMPLATE """<|start_header_id|>system<|end_header_id|> Cutting Knowledge Date : December 2023 {{ if .System }}{{ .System }} {{- end }} {{- if .Tools }} When you receive a tool call response, use the output to format an answer to the orginal user question. You are a helpful assistant with tool calling capabilities. {{- end }} <|eot_id|> {{- range $i , $_ := .Messa...

자세한 내용 보기

OS가 설치된 PM981A (512GB)를 A440Pro(2TB)로 NVME 마이그레이션 과정

조립대행으로 마춘 컴퓨터라 NVME 마이그레이션을 처음인데 무사히 마쳐서 2~3년뒤에 혹시 찾아볼까 싶어 기록으로 남깁니다. 사용하는 제품은 NVME 제품은 삼성전자 PM Pm981a M.2 NVME 512GB 인데 국내에서는 삼성전자 내장 SSD 970 EVO Plus NVMe M.2 500 GBMZ-V7S500BW https://www.samsung.com/sec/memory-storage/970-evo-plus-nvme-m2-ssd/MZ-V7S500BW/ 기존시스템 AMD 라이젠 3600 (마티스) MSI B450M 박격포 맥스 M2_1 은 PCI e3.0 M2_2 는 PCIe 2.0 삼성전자 PM Pm981a M.2 NVME 512GB C 드라이브가 점점 차올라서 TeamGroup A440 Pro PCIe 4.0x4 2TB 구입 11월25일 주문, 12월2일 배송 JEYI 방열패드 조립 https://youtu.be/idZ3ctqlpwo?si=Ade03n0afuMKTD9q 존스보 방열판보다는 더 두꺼우나 장착에는 문제가 없음. M.2 2nd slot에 장착 Migration Program 준비 여기서 시간소요 많이함, Free 버젼에서 Clone기능이 막혀있거나 Trial에서도 안되는 복제기능이 지원되지 않음. AOMEI backup Std Clone 미지원 AOMEI backup Pro Tirla Clone 미지원 Samsung Disk_Mirgration (지원하지 않는다는 이야기가 있어서 Skip) refect home trial 지원 refect home trial로 clone시 21분소요 PCIe 3.0 x4 에서 PCIe 2.0 x4 로 clone C: Pm981a spec상 속도가 3500MB/s, 쓰기 속도는 3200MB/s F: A440 Pro spec상 속도가 7400MB/s, 쓰기 속도는 7000MB/s 복제완료후 PCIe 3.0 의 PM981A와 PCIe 2.0 의 A440 Pro를 스왑 해매는 포인트 여기서 약간 해맸...

자세한 내용 보기

DELL의 새게이밍 노트북, Inspiron 15 7000 Gaming, Dual Display 문제

Dell New 게이밍노트북 7567 I7 Notebook http://www.dell.com/kr/p/inspiron-15-7567-laptop/pd?ref=PD_OC 7th Generation Intel® Core™ i7 프로세서 8GB 메모리 1TB 하드 드라이브 + 128GB 솔리드 스테이트 드라이브 NVIDIA® GeForce® GTX 1050 Ti (4GB GDDR5 그래픽 메모리 포함) 상세 사양 리눅스 개발환경이 필요해서 여러대 구매한 노트북입니다. 기본적으로 ubuntu 16.04 가 설치되어 있는데, 필요한 개발환경이 ubuntu 이고 별도의 windows 개발용 PC가 있기 때문에 구매를 결정하게 되었습니다. Slim하지 않지만 I7 HQ CPU와 1050TI spec 이 결정하는데 주요했고, 받은 후에 빌드환경 구축후 8 thread compile을 만끽하던중 치명적인 문제를 Display쪽 문제를 발견하고, Dell express 쪽과 전화통화도 하고 문의 메일도 보내서 지원을 받고(진행)중입니다. 추가 : 시간낭비하지 말라고 중간에 업데이트합니다. 해결되었고, 해결방법은 Windows 을 설치한 후 Fn+F8을 눌러서 모드를 확장모드를 선택합니다. 디스플레이 설정이나 드라이버 재설치 같은 방법으로는 조정이 불가능했습니다. --------------------------------------------------------------------- 요즘 다들 Dual monitor 환경일텐데, Dual Monitor를 복제형태로만 지원을 합니다. 14.04 설치후 업데이트시 375.66 Driver가 설치됩니다. nVidia driver가 설치되었으나, 모니터 인식에 문제가 있어서 해상도 확장설정자체를 할 수 없습니다. 기본 ubuntu라서 driver 문제인가 확인하기 위해서 우분투 64bit 환경 NVIDIA...

자세한 내용 보기

Oh Happy Life

이 블로그 검색