2024-02-08から1日間の記事一覧

『Pythonではじめる情報検索プログラミング』(佐藤 達也著、森北出版、2020年12月18日発行)

単語 文字Nグラムとは、長さNの部分文字列のこと。N=1はユニグラム、N=2はバイグラムという。文字Nグラムの頻度分布でテキスト中の良く使われている部分文字列を調べたり、隣り合う確率の高い文字を調べることができる。 Physonの形態素解析モジュールにはMe…