Hippo's data
[서평] LLM 서비스 설계와 최적화(슈레야스 수브라마니암 저/김현준, 박은주 역/한빛미디어) 본문
"한빛미디어 서평단 <나는리뷰어다> 활동을 위해서 책을 협찬 받아 작성된 서평입니다."
오늘은 한빛미디어에서 발간한 ' LLM 서비스 설계와 최적화 ' 책 서평을 작성해보겠습니다!!
리뷰하기 전에 저에 대해 간단히 소개하자면, 저는 LLM분야는 잘 모르는 어디서 주워들은 매우 협소한 지식만 있는 학생입니당,,,,,
특히 엔지니어틱?한 서비스 개발, 배포측면에서는 더더욱 까막눈이구욥,,,,
그래서! 초보자의 입장에서 해당 책을 리뷰해도록 하겠습니다
책 디자인은 뭔가 대학교 전공서적 느낌인데욥,,,, 겁나 무섭게 생겼습니다
# LLM(Large Language Model) 이란?
리뷰하기에 앞서 책 제목에 크게 쓰여있는 LLM에 대해 알아보겠습니다!
요즘 LLM이 인공지능 분야에서 되게되게 핫한 분야, 뜨거운 감자로 각광받고 있는데욥
요즘 모르는 사람들이 없다는 OpenAI의 챗GPT(ChatGPT), 구글의 제미나이(Gemini) 역시 LLM에 속합니다!
LLM은 방대한 데이터를 학습한 AI인데요
언어이해 및 생성, 요약, 번역 코드작성 등 다양한 작업에서 인간처럼 혹은 인간을 뛰어넘는 수행능력을 보여주고 있습니다.
이런 기술이 발전하면서, 영화 ‘터미네이터’처럼 인간 수준의 지능(AGI)이 실제로 나올 수 있다는 기대와 논의가 활발지고 있는데요
즉, LLM의 뛰어난 언어 능력과 문제 해결력 덕분에
“AI가 인간처럼 생각하고 행동하는 시대가 올까?”라는 화두가 생겨난 것입니다!!
# 책 구성
해당 책은 외국에서 발간된 책을 번역한 서적인데욥
Large Language Model-Based Solutions: How to Deliver Value with Cost-Effective Generative AI Applications
IT 분야 도서에서 자주 접하는 와일리(Wiley) 출판사에서 출간한 책입니다!
특히 해당 책의 원저자인 슈레야스 수브라마니암(Shreyas Subramanian)은 인도계 미국인 데이터 과학자로, AWS의 데이터 사이언티스트로 재직중이라고 합니다!
이 책의 부제는 '비용은 낮추고 성능은 극대화하는 AI 서비스 구축과 운영 가이드' 인데욥 말 그대로 대규모 언어 모델(LLM) 기반 AI 서비스를 설계하고 최적화하는 방법에 대한 가이드를 제공합니다
특히 원저자께서 실제로 현업에서 활발히 활동하는 분이시다보니 LLM 이론 뿐만 아니라 LLM 기반 서비스 개발, 운영에 필요한 실무적인 지식을 구체적으로 제시합니다!
CHAPTER 1 LLM 기초
_1.1 생성형 AI 애플리케이션과 LLM
_1.2 생성형 AI 애플리케이션의 상용화를 위한 길
_1.3 비용 최적화의 중요성
_1.4 요약
CHAPTER 2 비용 최적화를 위한 튜닝 기법
_2.1 파인튜닝 및 커스터마이징
_2.2 파라미터 효율적 파인튜닝(PEFT)
_2.3 PEFT의 비용 및 성능에 대한 영향
_2.4 요약
CHAPTER 3 비용 최적화를 위한 추론 테크닉
_3.1 추론 테크닉 소개
_3.2 프롬프트 엔지니어링
_3.3 벡터 스토어를 이용한 캐싱
_3.4 긴 문서를 관리하는 체인
_3.5 텍스트 요약
_3.6 효율적인 추론을 위한 배칭 프롬프트
_3.7 모델 최적화 방법
_3.8 파라미터 효율적 파인튜닝(PEFT)
_3.9 비용 및 성능 영향
_3.10 요약
CHAPTER 4 모델 선택과 대안
_4.1 모델 선택의 중요성
_4.2 효율적인 소형 모델
_4.3 성공적인 소형 모델 사례
_4.4 도메인 특화 모델
_4.5 범용 모델을 활용한 프롬프트의 성능
_4.6 요약
CHAPTER 5 인프라 및 배포 튜닝 전략
_5.1 튜닝 전략
_5.2 하드웨어 활용 및 배치 튜닝
_5.3 추론 가속화 도구
_5.4 모니터링과 옵저버빌리티
_5.5 요약
CHAPTER 6 성공적인 생성형 AI 도입의 열쇠
_6.1 성능과 비용의 균형
_6.2 생성형 AI 애플리케이션의 미래 트렌드
_6.3 요약
해당 책의 목차는 다음과 같은데욥
목차에서도 알 수 있듯이 LLM 이론 + 다양한 튜닝기법, 비용최적화 테크닉, 배포 등 실무적인 측면도 제시합니다
특히 각 카테고리별로 간단히 넘어가는 것이 아니라 매우 구체적인 이론 + 코드를 제시하고 있습니다!
해당 LLM 모델을 실습해볼 수 있는 허깅페이스 링크 + 해당 내용의 근거자료인 논문이 기재된 아카이브(arXiv) 링크도 주석으로 제공되어 있으니 해당 파트에 대해 더 심화적으로 알아볼 수 있습니다!
아래 사진은 책 내용중, PEFT(Parameter-Efficient Fine-Tuning)에 관련된 여러 방법론들이 제시된 부분인데요!
라이브러리를 볼 수 있는 허깅페이스, 각 방법론들이 제시된 논문 링크들을 제시하고 있습니다!
해당 부분에서는 모델의 가중치를 낮은 비트(4bit, 8bit)로 변환해 모델의 추론/학습 속도를 높이는 양자화(Quantization) 기법이 구현된 autowq 라이브러리를 사용하는 예시 코드가 나와 있네욥!!
# 그래서 누구에게 추천하는가?
해당책을 읽어 보니 크게 두 부류의 사람들에게 추천하면 좋겠도라구욥
1. LLM 서비스를 운영하며 비용을 절감하고 성능을 극대화해야 하는 LLM 전문가
2. 딥한 실력은 없지만 LLM에 대해 관심이 있는 독자
LLM 서비스와 관련해서 매우 구체적으로 특히 최신 트랜드, 연구방향 등을 총망라해서 볼 수 있는 책으로, 해당 분야의 전문가들이 보면 매우매우 좋겠다는 생각이 들었구요 혹은 저처럼 LLM에 대해서는 구체적으로는 모르지만 관심이 있는 독자들에게 추천합니다!
저는 개인적으로 LLM기술에 대해 이론적인 측면에 대해서만 주로 접해봤는데요
실제 LLM이 현업에서 서비스 될 때 고려해야하는 성능, 비용, 인프라 측면들을 알아볼 수 있어서 매우 유익했던 것 같아요!
(비용적인 측면에서 도메인 특화 모델 or 매우 큰 모델 어떤 모델을 선택하는 것이 좋을지,부분적으로 파인튜닝 진행할지 or 초기부터 사전학습으로 모델 새롭게 구축할지 등)
하지만 어느정도 AI 특히 LLM과 관련된 지식이 필요한데요
완전 뉴비가 처음 책을 펴서 읽기에는 처음보는 외계어일거에요,,,,
'Book' 카테고리의 다른 글
[서평] 만만한 자소서(취업왕 이쌤 저/한빛미디어) (2) | 2025.04.08 |
---|---|
[서평] 파이썬으로 웹 크롤러 만들기(라이언 미첼 저/최경현 역/한빛미디어) (0) | 2025.03.24 |
[서평] 로우코드 AI(궨덜린 스트리플링, 마이클 아벨 저/박찬성 역/한빛미디어) (0) | 2025.02.27 |
[서평] 혼자 공부하는 얄팍한 코딩 지식(고현민 저/한빛미디어) (1) | 2024.07.26 |
[서평] 하루 3분, 세상에서 가장 쉬운 IT 수업(장종원 저/루비페이퍼) (2) | 2024.03.01 |