・統計解析用ソフトウェアRを用いた食農にかかわるデータサイエンスを基礎から体系的に学ぶ実践書
・本文対応のRプログラムをNTSデジタルふろくサイト「デジふろ」から入手できる
第1編 プログラミング基礎編
第1章 食農データサイエンスとR
1 なぜRなのか
2 本書の構成
第2章 Rプログラミング基礎
1 はじめに:事前準備
2 プログラミング基礎
3 日本語を含むデータのファイルからの読み込み
4 箱ひげ図
5 cvsファイルからの入力
6 ベクトルの特徴
7 繰り返し数列,重複削除,順番に関わる演算
8 集合に関わる演算子
9 リストの特徴
10 行列
11 関数を定義する
12 apply 系関数
13 apply( ) 関数
14 tapply( ) 関数
15 lappy( ) 関数とsapply( )関数
16 mapply( ) 関数
17 ヒストグラム
18 散布図
第3章 連続分布による統計学
1 はじめに
2 推測統計学とは
3 平均値と不偏分散(標準偏差)
4 正規分布
5 t分布
6 χ2分布
7 F分布
第4章 離散分布による統計学
1 はじめに
2 数学的準備
3 二項分布,二項検定
4 二項分布,二項検定(サイコロで復習)
5 二項分布,二項検定の活用例:符号検定(n ≤ 25)
6 二項分布,二項検定の活用例:符号検定(n > 25)
7 超幾何分布
8 独立性の検定
9 ポアソン分布
10 Wilcoxon 符号つき順位和検定:対応がある2 群の検定
11 Wilcoxon 順位和検定:対応がない2 群の検定
12 統計検定のまとめ
第2編 実践編
第5章 食品分析の統計学
1 はじめに
2 室内精度の推定
3 内部精度管理(内部品質管理)
4 モンテカルロシミュレーションによる不確かさの推定
第6章 コーヒーのデータサイエンス:主成分分析,最適クラスター数,多重性検定
1 はじめに
2 教師なし学習(unsupevised Learning)
3 主成分分析法
4 散布図の作成法:plot( ),points( ),text( )
5 クラスター分析(階層法,凝集法)
6 多重検定
7 無香料と香料コーヒーの違いを考察する
8 最適クラスターの推定:k 平均法とギャップ統計量の活用
9 総合的考察
第7章 棒茶のデータサイエンス:機械学習を中心に
1 はじめに
2 棒茶データ
3 特徴抽出
4 主成分分析
5 教師あり学習(分類問題)
6 caretパッケージ
7 線形判別分析法
8 k最近隣法(kNN法)
9 決定木
10 アンサンブル学習:バギング,ランダムフォーレスト,ブースティング
11 総合的考察
第8章 おわりに
1 分析結果を生産するラボに求められる管理と統計処理
2 食品の安全を守るための行政データの活用
3 若い世代のデータサイエンティストへの期待
4 地方固有の希少食材からその魅力を発掘するデータサイエンス