問題

gensimを使用して単語のベクトル表現を取得する必要があります。使用するのに最適なのは、英語のウィキペディアコーパスで訓練されたword2vecモジュールです。誰かがそれをダウンロードする場所、それをインストールする方法、およびgensimを使ってベクトルを作成する方法を知っていますか?

  ベストアンサー

@imanzabetは、あらかじめ訓練されたベクトルを持つ有用なリンクを提供していますが、あなたが2つのことをする必要があるよりも、ジェニズムを使ってモデルを訓練したい場合:

  1. ここでにアクセスできるWikipediaデータを取得します。最新の英語ウィキペディアのスナップショットは20日にあり、ここでを見つけることができます。私は他のEnglish-language "wikis"と信じています。 引用符は別々にキャプチャされるので、それらを含める場合は、それらもダウンロードする必要があります。

  2. データをロードしてモデルを生成するために使用します。これはかなり広い質問なので、優れたジェニズムのドキュメント word2vecチュートリアルにリンクします。

最後に、あなたのユースケースを正確に記述するのブログ投稿があるようです。

  同じタグがついた質問を見る

wikipediagensimword2vec