人のニューロンの配線:ヒト・コネクトーム
周囲の環境だけに反応するロボット:ルンバ
人工知能第一次ブーム:記号処理
・ELIZA。ユーザーの言葉を受動的に受け取るだけ。
・SHRDLU:シャードル
・フレーム問題
・役に立たず下火になる。
第二次ブーム:知能とは知識
・第5世代コンピュータ
・GUS:フレーム表現構造で知識を持つ
・エキスパートの知識を取り出してシステムに入力するのが大変なため下火になる。
第三次ブーム:知能とは学習
・データが全てという考え方:機械が学習するためのデータ
自動評価尺度が決まると開発の効率が良くなる
・機械翻訳ではBLEUという尺度が有名。人間の翻訳の中に機械による翻訳が入っている個数
探索⇒木構造で表せる。オープンリストとクローズドリストでも表せる。
・深さ優先探索は分岐点でまだ試していない方向を一つずつ試す。行けなくなったら元に戻る
・均一コスト探索は距離を考慮して、近いものを優先する
・A*(エースター探索)は知識を用いる探索。スタート地点からその地点までの距離とその地点からゴール地点までの距離の見積りの合計(予想コスト)の小さいものから探索する。
・向きを考慮した探索、ネットワーク図、最適性の原理「動的計画法」
・開始状態-中間状態-終了状態、状態間遷移の可否、遷移のコストが分かっているとき探索問題とできる。
・ゲームの場合は、相手がいるのでミニマックス探索になる。結果から遡る。大きいときは中間で評価し、評価値で探索する。効率的にするためαカット、βカットがある。
・知識とは何か? 信じている。事実である。事実であると考える理由がある、3つの条件を満たすとき。
・宣言的知識、手続き的知識、身体的知識、常識。(人間が書き出せるのは、宣言的知識と手続き的知識のみ)
・推論:演繹的推論、機能的推論、仮説推定
・意味ネットワークで宣言的知識の表現:is-a、has-a、likesなど
・命題論理の操作5種類:否定¬、連言(かつ)∧、選言(または)、含意(ならば)→、同値≡
・真理値表、ド・モルガンの法則、反駁による証明(命題を否定した結果として矛盾が出る⇒反駁の否定が誤り)
・命題論理で真偽の判断をする:反駁による証明、導出原理
・述語論理 全ての・・・は・・・である:全称記号∀、・・・な・・・もいる:存在記号∃
・知識の表現:フレーム表現、セマンティックWeb
・手続き的知識の表現方法:ルール知識(IF-THEN)、プラン知識(目的達成の行動に関して、アクション、前提、効果で表す)、スクリプト(台本、状況理解に使う)
・エキスパートシステム:プロダクションルールをもつ。ルールの前提をマッチさせる、競合の解消、メモリへの書き込みを実行する。分類型、組み合わせ型、混合型がある。
・身体値、暗黙知、常識
・機械学習には、教師有り学習、教師なし学習、強化学習の3種類がある。
・教師有り学習には、正解の与えられ方により、半教師有り学習、転移学習、ゼロショット学習がある。
・回帰分析、重回帰分析は誤差の2重和を最小にする。最小自乗法で分類もできる。
・単純ベイズ分類器は、確率のベイズ定理を使う。生起する可能性を計算して大きい方を採用する。
・決定木学習は、分類したときのエントロピーを計算する。エントロピーの1番小さい分類から順にツリーを作る。
・ニューラルネットワークのノードは入力の線形和を受け取り、シグモイド関数の出力を得る。ノードの結合である。シグモイド関数はニューロンの特性を表す。
・上達する=強化学習:結果の善し悪しを報酬で評価する。Q学習が有名。QテーブルとRテーブル(報酬表)を用意して試行錯誤の行動結果の評価によってQテーブルを更新する。
・文字列検索:1文字ずつずらしながらヒットを探す。ボイヤー・ムーア法はジャンプテーブルを用意する。
・辞書引き:バイナリサーチ、トライ木(辞書を木構造で表現した構造、文字のツリーで各ノードに単語を割り付け)
・形態素解析:単語に分割する、品詞を与える。英語は品詞を与えるのみ。
・品詞のもっともらしさは統計的に推定。コーパスの中で頻度の多いものを選ぶ。ゼロ頻度問題への対処が必要。
・日本語の形態素解析では単語区切りが必要で、これは辞書引きによる。単語列挙はトライ木で。
・生成文法:チョムスキーの提唱による。言語処理では2型文法=文脈自由文法が良く使われる。
・文書のランク付け TF-IDF:TFは単語の頻度、IDFは文書頻度の逆数(IDF=log(文書数/単語が出現している文書数)
・単純ベイズ分類器によるスパムフィルタ
・人工知能による対話、対話システム
・感情