ブログ記事からの店舗名抽出かー
ブログ記事から店舗名抽出できないかな、と思って
いろいろ簡単なアプローチを試したのですが無理ですね。
下手な鉄砲を打ちまくれば再現率は上げることができますが、
精度はボロボロになってしまいます。
なにしろ、抽出した断片を店舗名じゃないと認識するのが
とてつもなく難しい。
いろいろ考えたら、固有名詞抽出をまじめにやれば、
店舗名を単純なアプローチよりは高い精度で抽出できますね。
ということに気が付いたら夜になっちゃいました。あーあ。
投稿者:としのり 日時:23:59:59 | コメント | トラックバック() |

