統一された基準は重要です(xlog のリンク参照形式のテスト)
2024-04-10、午後 2 時から 4 時 5 分まで、2 時間かけて PyHanLP を動作させることができました!以下に学んだ知識を記録します👇
卒業設計の一環として、テキストから非構造化情報を抽出する必要があったため、Python に PyHanLP をインストールしました。
以下に私が遭遇した問題を共有します。時間があれば、HanLP について説明しますが、時間がなければ無視します。
この記事では、実際の経験を通じて、欠落した概念が仕事をより複雑にする可能性があることを証明します!もし私がこの概念を重視し、その影響を理解していたら、Python の仮想環境に特化した専門ツールである Conde を学ぶことを選択したかもしれません。そして、HanLP というサードパーティライブラリをダウンロードします。
HanLP の簡単なインストールの注意事項#
私は公式ウェブサイトの簡単なインストールパッケージを使用しましたが、この簡単なインストールパッケージは私を本当に馬鹿にしていました。インストールディレクトリを選択することさえ許されず、Java 環境、HanLP、および新しい Python 3.8 が一括でインストールされました!
しかも、これらのものはすべて C ドライブにインストールされました!
元々の Python 3.12 では PyHanLP を呼び出すことができませんでしたが、PyHanLP は傻瓜インストールされた Python 3.8 からのみ呼び出すことができます。
この問題を解決するために、プロジェクトの仮想環境の Python 3.12 を Python 3.8 に変更しようとしましたが、変更後に書いたコードが機能しなくなりました - その理由は、Python 3.8 にはこれらのライブラリがインストールされていないためです。
そこで私は理解しました、仮想環境の Python バージョンも指定されていることを。仮想環境でインタプリタを Python 3.8 に変更しても、仮想環境にインストールされた Python 3.12 の pip ライブラリを使用することはできません。なぜなら、これらのライブラリは Python 3.12 のみを認識するからです!したがって、新しい仮想環境を作成する必要があります。
その後、新しい仮想環境を作成し、Python 3.8 を呼び出し、以前のコードをすべてコピーし、必要なサードパーティライブラリを再度ダウンロードしましたが、問題は再び私の前に現れました。
PyHanLP を実行しようとすると、ターミナルでこのライブラリを見つけることができませんでした。私は再び理解しました、PyHanLP はグローバル環境のライブラリであり、仮想環境からはグローバル環境のライブラリを呼び出すことはできません。
しかし、問題は、仮想環境のターミナルでpip install pyhanlp
を使用しても、それをダウンロードすることができないことです。だから私は傻瓜インストールパッケージを選んだのです。つまり、仮想環境で PyHanLP を使用することはできません。私は C ドライブの Python 3.8 を使用し、ライブラリをすべて C ドライブにインストールするしかありません!
この問題を解決するために、仮想環境を使用するのを諦め、直接グローバル環境を使用する必要があります。Python 3.8 をコンピュータの環境変数に追加し、Python 3.8 の優先度を Python 3.12 よりも高くする必要があります。これにより、ターミナルで使用するpip install
コマンドは Python 3.8 に対してのみ適用されます。
仮想環境の場合、私がインストールしたすべてのライブラリは、コードが存在するフォルダにインストールされます - 私はもちろん C ドライブには置きません。
これらの障害が私に仮想環境の真の意味を理解させました - 独自の pip ライブラリを持ち、他の Python インタプリタの作業環境とは独立しています!
私の C ドライブはさらに多くのライブラリをダウンロードすることになりますが、メモリが少ないのです。これはすべて、私が仮想環境で PyHanLP をインストールできなかったためです!そして、私は以前「仮想環境」を理解していなかったためです。
私は初心者ですが、少なくとも今日の経験からいくつかのアドバイスを提供できるかもしれません。
Python 初心者の場合:多くの Python サードパーティライブラリをダウンロードし、Python を使用して作業を頻繁に行い、C ドライブに負担をかけたくない場合(他のドライブに保存したい場合)、Conde を正直にダウンロードしてください(Conde は Python ライブラリを管理し、仮想環境を作成するためのプラットフォームです)。
HanLP ライブラリを使用したい場合、公式ウェブサイトでは conda のダウンロード方法も提供されており、2 行のコードでインストールできます(傻瓜インストールパッケージよりも複雑ではありません)。そして、conda でインストールパスを設定すれば、インストールされる PyHanLP は C ドライブに傻傻にインストールされないと思います!
仮想環境とは何ですか#
簡単に言えば、仮想環境とは、特定のバージョンの Python と独自の pip ライブラリを使用することです。
- 仮想環境は、新しい Python をインストールしたのと同じようなものですが、実際には新しい Python をインストールするわけではありません。仮想環境の作成はメモリをほとんど使用しません。
- プロジェクトが仮想環境にアクティブ化されている場合、その環境にインストールされた Python ライブラリのみを使用できます。元の Python に多くのライブラリがあっても、仮想環境の Python からはそれらを呼び出すことはできません。
- 仮想環境は、プロジェクトごとに必要なライブラリと他のプロジェクトのライブラリを区別するために使用され、各プロジェクトファイルにとってスペースを節約します。
VSCode で仮想環境を作成する方法#
VSCode でプロジェクトに専用の Python 仮想環境を作成する方法:
- VSCode を開き、フォルダを開きます
- 右下の VSCode の Python エディタをクリックし、「仮想環境の作成」を選択し、作成する仮想環境と使用する Python のバージョンを選択します
- 新しいターミナルを作成し、ターミナルに
. \ venv \ Scripts \ activate
と入力して仮想環境をアクティブにします。これは、ターミナルをこのディレクトリに移動させるだけです。注意すべきは、次回 VSCode でこのフォルダを開くときは、仮想環境をアクティブにする必要がないことです。ソフトウェアが自動的に移動します。
この問題の結末#
私は HanLP を再インストールするために Conde をダウンロードするつもりはありませんが、C ドライブに設定されたすべてのものをこの傻瓜インストールパッケージを使用して永遠に使用するつもりもありません。
Conde の使用方法を学ぶ時間がもうありません。英語のインターフェースであるだけでなく、半日の時間も非常に貴重です。私は忙しいことがたくさんあります。
大学院に合格した後、この素晴らしいツールをしっかりと操作することができるでしょう!今は妥協するしかありません。C ドライブで卒業設計を完成させます。