Pythonではじめるテキストアナリティクス入門

榊剛史・編著 石野亜耶/小早川健/坂地泰紀/嶋田和孝/吉田光男・著
シリーズ:
実践Data Scienceシリーズ

Pythonではじめるテキストアナリティクス入門

発行
2022/03/08
サイズ
B5変
ページ数
256
ISBN
978-4-06-527410-1
定価
2,860円(税込)
在庫
在庫あり

書籍を購入する

定価
2,860円(税込)

内容紹介

基礎技術と分析アプローチがわかる入門書の決定版!
◆「spaCy+GiNZA」による一気通貫の分析がすぐに実践できる!
◆観光情報/金融・経済/ソーシャルメディアの分析事例をていねいに解説!
◆つまずきやすい「環境構築」もしっかりサポート!
この1冊からはじめよう!

目次

はじめに
 0.1 本書のねらい
 0.2 本書の読み方


第I部 テキストアナリティクスの基礎

第1章 テキストアナリティクスことはじめ
 1.1 テキストアナリティクスとは?
 1.2 分析のためのアプローチ
 1.3 分析のための基盤技術
 1.4 まとめ:自然言語処理を学ぶために

第2章プログラミングの補足知識
 2.1 文字コード
 2.2 ファイルの入出力
 2.3 正規表現
<note>正規表現のテスト・可視化方法
 2.4 内包表記
 2.5 まとめ:Pythonを使いこなすために

第3章 環境構築
 3.1 Linux
 3.2 macOS
 3.3 Windows
 3.4 Pythonの仮想環境
<note>仮想環境の必要性
 3.5 まとめ:より快適な環境を構築するために

第4章 基礎技術
 4.1 基礎的な解析
<note>spaCyの基本的な考え方
 4.2 文書の分類・クラスタリング
 4.3 可視化
<note>単語共起行列の計算
 4.4 まとめ:より深い分析を実現するために


第II部 テキストアナリティクスの実践

第5章 データ収集
 5.1 公開データ
 5.2 社内データ
 5.3 データ購入
 5.4 ウェブクローリング

第6章 観光テキストの解析
 6.1 データの入手:観光テキスト解析に利用できるソーシャルメディアの例
 6.2 口コミを利用した観光地の分析
 6.3 口コミを利用したテーマパークの分析
 6.4 分析上の注意点
 6.5 研究の紹介

第7章 金融・経済テキストの解析
 7.1 事前準備:金融・経済における極性分析
 7.2 データの入手:金融・経済テキストデータの入手
 7.3 基礎的な解析:基礎的なテキスト分析
 7.4 分析:有価証券報告書を用いた日経平均予想
 7.5 分析上の注意点
 7.6研究の紹介

第8章 ソーシャルメディアテキストの解析
 8.1 Twitterデータによる世情分析
 8.2 2ちゃんねるデータによる世情分析
 8.3 大規模データ処理に対する工夫
 8.4 研究の紹介

第III部 応用技術・発展的な内容
第9章 実践的なテクニック
 9.1 単語処理に関するテクニック
 9.2 その他のツールの比較と利用方法
 9.3 まとめ
<note>根性マイニング

第10章 深層学習技術
 10.1 単語分散表現
 10.2 文分散表現
 10.3 BERTをはじめとするTransformerモデルの利用
 10.4 まとめ

第11章 環境構築の要らないテキストアナリティクス
 11.1 Google Colaboratoryを利用したテキストアナリティクス
 11.2 自然言語処理APIを利用したテキストアナリティクス
 11.3 まとめ

付録 本書で利用するPythonライブラリ