Kaggleではじめる大規模言語モデル入門 自然言語処理〈実践〉プログラミング

内容紹介

「あなたのLLMスキル、「実戦」で通用しますか？　ファインチューニング、RAG、量子化、モデルマージ......知識や理論を知っているだけでは、性能を引き出すことはできません。トップKagglerたちはスコアを削り出すために、何を試し、何を捨て、なぜその手法を選んだのか。課題解決のための"本物"の技術を身につけられる一冊です。」
秋葉拓哉氏推薦！！
（Sakana AI Staff Research Scientist）

従来のKaggle関連書籍では、十分に取り扱うことができずにいたテキストデータを扱うコンペティション（NLPコンペ）に焦点を当てた初の書籍！注目が集まっている大規模言語モデルに関する内容をふんだんに盛り込み、基本的な使い方から、性能を底上げする応用的な使い方まで幅広く解説。
・実践的な課題解決の場で得られた知見をもとに内容を構成し、教科書的な書籍とは異なる実用的な視点を提供。コンペ参加者に限らず、大規模言語モデルに関心を持つエンジニアや研究者にとっても有益！
・基礎編では、基礎知識のみにとどめず、大規模言語モデルの性能をさらに引き出すための、実践的な暗黙知や勘所などのウラ側も詳しく解説。コンペの上位スコアを追体験できるサンプルコードも提供。
・応用編では、多彩な8つのKaggleコンペを題材に、概要・データ構造・評価指標を整理し、ベースラインとして公開されている手法および上位解法を紹介。

【基礎編の編著者の紹介】
高野海斗、Kaggle Master、https://www.kaggle.com/takaito
主に1、3章を執筆。資産運用会社で自然言語処理技術を活用した投資戦略の開発や業務効率化ツールの開発を担当。Kaggleでは「LLM - Detect AI Generated Text」コンペで単独で金メダルを獲得したほか、さまざまなコンペでメダルを獲得。共著に『自然言語処理の導入と活用事例』。博士（理工学）。大阪公立大学客員研究員。人工知能学会企画委員（コンペ担当）。

齋藤慎一朗、Kaggle Master、https://www.kaggle.com/sinchir0
主に 4、5、10章を執筆。Sansan株式会社研究開発部シニアリサーチャー。業務ではファインチューニングしたLLMを活用したプロダクト改善に従事。Kaggleでは「The Learning Agency Lab - PII Data Detection」コンペや「LMSYS - Chatbot Arena Human Preference Predictions」コンペにて銀メダルを獲得。LLMの技術記事を多く投稿。Kaggle Competitions MasterおよびNotebooks Master。共著に『Polarsとpandasで学ぶデータ処理アイデアレシピ55』。

石原祥太郎、Kaggle Master、https://www.kaggle.com/sishihara
主に2章の執筆と全体の編集を担当。株式会社日本経済新聞社でLLMの開発や利活用を推進。Kaggleでは「PetFinder.my Adoption Prediction」コンペの優勝をはじめ、Kaggle Days Tokyoでのコンペ開催、「Kaggle Days Championship Final 2022」進出など、幅広い経験を持つ。共著に『PythonではじめるKaggleスタートブック』『Kaggleに挑む深層学習プログラミングの極意』『事例でわかるMLOps』、訳書に『Kaggle Grandmasterに学ぶ機械学習実践アプローチ』。2019 年から「Weekly Kaggle News」を配信している。人工知能学会企画委員（コンペ担当）、Google Developer Expert（AI、Kaggle）。

【応用編の寄稿者の紹介】
坂見耕輔さん（6章）／中真人さん（7章）／郭林升さん（8章）／三好拓志さん（9章）／村上直輝さん（11章）／洪立航さん（12章）／吉原浩之さん（13章）／井ノ上雄一さん（13章）／山口大器さん（13章）
各寄稿者の詳細なプロフィールは、サポートサイトに掲載しています。
https://github.com/sinchir0/kaggle_llm_book/blob/main/profiles.md

Kaggleではじめる大規模言語モデル入門

自然言語処理〈実践〉プログラミング

内容紹介

目次