[PYTHON] 코드에서 nltk 데이터 디렉토리를 설정하는 방법은 무엇입니까?
PYTHON코드에서 nltk 데이터 디렉토리를 설정하는 방법은 무엇입니까?
코드에서 nltk 데이터 디렉토리를 설정하는 방법은 무엇입니까?
해결법
-
==============================
1.단순히 nltk.data.path의 항목을 변경하면 간단한 목록입니다.
단순히 nltk.data.path의 항목을 변경하면 간단한 목록입니다.
-
==============================
2.코드에서, http://www.nltk.org/_modules/nltk/data.html :
코드에서, http://www.nltk.org/_modules/nltk/data.html :
그런 다음 코드 내에서 :
###################################################################### # Search Path ###################################################################### path = [] """A list of directories where the NLTK data package might reside. These directories will be checked in order when looking for a resource in the data package. Note that this allows users to substitute in their own versions of resources, if they have them (e.g., in their home directory under ~/nltk_data).""" # User-specified locations: path += [d for d in os.environ.get('NLTK_DATA', str('')).split(os.pathsep) if d] if os.path.expanduser('~/') != '~/': path.append(os.path.expanduser(str('~/nltk_data'))) if sys.platform.startswith('win'): # Common locations on Windows: path += [ str(r'C:\nltk_data'), str(r'D:\nltk_data'), str(r'E:\nltk_data'), os.path.join(sys.prefix, str('nltk_data')), os.path.join(sys.prefix, str('lib'), str('nltk_data')), os.path.join(os.environ.get(str('APPDATA'), str('C:\\')), str('nltk_data')) ] else: # Common locations on UNIX & OS X: path += [ str('/usr/share/nltk_data'), str('/usr/local/share/nltk_data'), str('/usr/lib/nltk_data'), str('/usr/local/lib/nltk_data') ]
경로를 수정하려면 가능한 경로 목록에 추가하기 만하면됩니다.
import nltk nltk.data.path.append("/home/yourusername/whateverpath/")
또는 창에서 :
import nltk nltk.data.path.append("C:\somewhere\farfar\away\path")
-
==============================
3.나는 append를 사용한다.
나는 append를 사용한다.
nltk.data.path.append('/libs/nltk_data/')
-
==============================
4.uwsgi를 사용하는 사람들을 위해 :
uwsgi를 사용하는 사람들을 위해 :
이전에 다운로드 한 nltk 데이터에 액세스 할 수있는 uwsgi 앱 (자신보다 다른 사용자로 실행)을 원했기 때문에 문제가 발생했습니다. 나를 위해 일한 것은 myapp_uwsgi.ini에 다음 행을 추가하는 것이 었습니다 :
env = NLTK_DATA=/home/myuser/nltk_data/
이것은 @schemacs가 제안한 것처럼 환경 변수 NLTK_DATA를 설정합니다. 이 변경 후 uwsgi 프로세스를 다시 시작해야 할 수 있습니다.
-
==============================
5.NLTK는 모든 스크립트에 nltk.data.path.append ( 'your / path / to / nltk_data')를 추가하는 대신 NLTK_DATA 환경 변수를 허용합니다. (코드 링크)
NLTK는 모든 스크립트에 nltk.data.path.append ( 'your / path / to / nltk_data')를 추가하는 대신 NLTK_DATA 환경 변수를 허용합니다. (코드 링크)
~ / .bashrc (또는 ~ / .profile)을 텍스트 편집기 (예 : nano, vim, gedit)로 열고 다음 행을 추가하십시오.
export NLTK_DATA="your/path/to/nltk_data"
환경 변수를로드하기위한 소스 실행
source ~/.bashrc
파이썬을 열고 다음 줄을 실행하십시오.
import nltk nltk.data.path
이미 거기에 nltk 데이터 경로가 표시됩니다.
참조 : @ alvations의 대답 nltk / nltk # 1997
from https://stackoverflow.com/questions/3522372/how-to-config-nltk-data-directory-from-code by cc-by-sa and MIT license
'PYTHON' 카테고리의 다른 글
[PYTHON] 파이썬의 다중 핑 스크립트 (0) | 2018.10.04 |
---|---|
[PYTHON] 비표준 위치에 SSL을 지원하는 Python 구현 (0) | 2018.10.04 |
[PYTHON] Subprocess.Popen에서 "source"명령 호출 (0) | 2018.10.04 |
[PYTHON] 파이썬 2 개체를 파이썬 3으로 풀어주기 (0) | 2018.10.04 |
[PYTHON] 파이썬에서 float의 이진 표현 (16 진수가 아닌 비트) (0) | 2018.10.04 |