복붙노트

[PYTHON] 코드에서 nltk 데이터 디렉토리를 설정하는 방법은 무엇입니까?

PYTHON

코드에서 nltk 데이터 디렉토리를 설정하는 방법은 무엇입니까?

코드에서 nltk 데이터 디렉토리를 설정하는 방법은 무엇입니까?

해결법

  1. ==============================

    1.단순히 nltk.data.path의 항목을 변경하면 간단한 목록입니다.

    단순히 nltk.data.path의 항목을 변경하면 간단한 목록입니다.

  2. ==============================

    2.코드에서, http://www.nltk.org/_modules/nltk/data.html :

    코드에서, http://www.nltk.org/_modules/nltk/data.html :

    그런 다음 코드 내에서 :

    ######################################################################
    # Search Path
    ######################################################################
    
    path = []
    """A list of directories where the NLTK data package might reside.
       These directories will be checked in order when looking for a
       resource in the data package.  Note that this allows users to
       substitute in their own versions of resources, if they have them
       (e.g., in their home directory under ~/nltk_data)."""
    
    # User-specified locations:
    path += [d for d in os.environ.get('NLTK_DATA', str('')).split(os.pathsep) if d]
    if os.path.expanduser('~/') != '~/':
        path.append(os.path.expanduser(str('~/nltk_data')))
    
    if sys.platform.startswith('win'):
        # Common locations on Windows:
        path += [
            str(r'C:\nltk_data'), str(r'D:\nltk_data'), str(r'E:\nltk_data'),
            os.path.join(sys.prefix, str('nltk_data')),
            os.path.join(sys.prefix, str('lib'), str('nltk_data')),
            os.path.join(os.environ.get(str('APPDATA'), str('C:\\')), str('nltk_data'))
        ]
    else:
        # Common locations on UNIX & OS X:
        path += [
            str('/usr/share/nltk_data'),
            str('/usr/local/share/nltk_data'),
            str('/usr/lib/nltk_data'),
            str('/usr/local/lib/nltk_data')
        ]
    

    경로를 수정하려면 가능한 경로 목록에 추가하기 만하면됩니다.

    import nltk
    nltk.data.path.append("/home/yourusername/whateverpath/")
    

    또는 창에서 :

    import nltk
    nltk.data.path.append("C:\somewhere\farfar\away\path")
    
  3. ==============================

    3.나는 append를 사용한다.

    나는 append를 사용한다.

    nltk.data.path.append('/libs/nltk_data/')
    
  4. ==============================

    4.uwsgi를 사용하는 사람들을 위해 :

    uwsgi를 사용하는 사람들을 위해 :

    이전에 다운로드 한 nltk 데이터에 액세스 할 수있는 uwsgi 앱 (자신보다 다른 사용자로 실행)을 원했기 때문에 문제가 발생했습니다. 나를 위해 일한 것은 myapp_uwsgi.ini에 다음 행을 추가하는 것이 었습니다 :

    env = NLTK_DATA=/home/myuser/nltk_data/
    

    이것은 @schemacs가 제안한 것처럼 환경 변수 NLTK_DATA를 설정합니다. 이 변경 후 uwsgi 프로세스를 다시 시작해야 할 수 있습니다.

  5. ==============================

    5.NLTK는 모든 스크립트에 nltk.data.path.append ( 'your / path / to / nltk_data')를 추가하는 대신 NLTK_DATA 환경 변수를 허용합니다. (코드 링크)

    NLTK는 모든 스크립트에 nltk.data.path.append ( 'your / path / to / nltk_data')를 추가하는 대신 NLTK_DATA 환경 변수를 허용합니다. (코드 링크)

    ~ / .bashrc (또는 ~ / .profile)을 텍스트 편집기 (예 : nano, vim, gedit)로 열고 다음 행을 추가하십시오.

    export NLTK_DATA="your/path/to/nltk_data"
    

    환경 변수를로드하기위한 소스 실행

    source ~/.bashrc
    

    파이썬을 열고 다음 줄을 실행하십시오.

    import nltk
    nltk.data.path
    

    이미 거기에 nltk 데이터 경로가 표시됩니다.

    참조 : @ alvations의 대답 nltk / nltk # 1997

  6. from https://stackoverflow.com/questions/3522372/how-to-config-nltk-data-directory-from-code by cc-by-sa and MIT license