복붙노트

PHP로 PDF 파일보기

PHP

PHP로 PDF 파일보기

빌딩의 층간지도 인 대형 PDF 파일이 있습니다. 그것은 좌석 위치의 텍스트 상자를 포함하여 모든 사무용 가구에 대한 레이어가 있습니다.

제 목표는 PHP로이 파일을 읽고, 텍스트 레이어를 찾기 위해 문서를 검색하고, 파일의 내용과 좌표를 가져 오는 것입니다. 이렇게하면 좌석 위치 -> x / y 좌표를 매핑 할 수 있습니다.

PHP를 통해이를 수행 할 수있는 방법이 있습니까? (또는 Ruby 나 Python이 필요한 경우)

해결법

  1. ==============================

    1.FPDF (FPDI 포함) 확인 :

    FPDF (FPDI 포함) 확인 :

    http://www.fpdf.org/

    http://www.setasign.de/products/pdf-php-solutions/fpdi/

    이것들은 당신이 pdf를 열어 PHP에서 그 안에 내용을 추가하게합니다. 필요로하는 값에 대해 기존 콘텐츠를 검색하는 기능을 사용할 수도 있습니다.

    또 다른 가능한 라이브러리는 TCPDF입니다. http://www.tecnick.com/public/code/cp_dpage.php?aiocp_dp=tcpdf

    최신 라이브러리를 추가하려면 업데이트 : PDF Parser

  2. ==============================

    2.PHP 라이브러리 (pdfparser)가 있습니다.

    PHP 라이브러리 (pdfparser)가 있습니다.

    프로젝트 웹 사이트

    http://www.pdfparser.org/

    기둥

    https://github.com/smalot/pdfparser

    하지만 ぱげ / 아피

    http://www.pdfparser.org/demo

    프로젝트에 pdfparser를 포함하면 mypdf.pdf에서 모든 텍스트를 다음과 같이 얻을 수 있습니다.

    <?php
    $parser = new \installpath\PdfParser\Parser();
    $pdf    = $parser->parseFile('mypdf.pdf');  
    $text = $pdf->getText();
    echo $text;//all text from mypdf.pdf
    
    ?>
    

    Simular를 사용하면 pdf에서 메타 데이터를 가져올 수있을뿐만 아니라 pdf 객체 (예 : 이미지)를 가져올 수 있습니다.

  3. ==============================

    3.흠 ... 정확히 PHP는 아니지만, PHP에서 프로그램을 호출하여 pdf를 임시 html 파일로 변환 한 다음 결과 파일을 PHP로 구문 분석 할 수 있습니다. 나는 내 프로젝트와 비슷한 것을했는데 이것은 내가 사용했던 프로그램이다.

    흠 ... 정확히 PHP는 아니지만, PHP에서 프로그램을 호출하여 pdf를 임시 html 파일로 변환 한 다음 결과 파일을 PHP로 구문 분석 할 수 있습니다. 나는 내 프로젝트와 비슷한 것을했는데 이것은 내가 사용했던 프로그램이다.

    PdfToHtml

    프로그램에서 멋진 점은 절대 위치 좌표를 사용하여

    태그의 텍스트 요소를 뱉어내는 것입니다. 이것이 바로 당신이하려는 일인 것처럼 보입니다.

  4. ==============================

    4.이 응용 프로그램 http://pdfbox.apache.org/을 사용해 볼 수도 있습니다. 실제 사례는 https://www.jinises.com에서 확인할 수 있습니다.

    이 응용 프로그램 http://pdfbox.apache.org/을 사용해 볼 수도 있습니다. 실제 사례는 https://www.jinises.com에서 확인할 수 있습니다.

  5. ==============================

    5.초기 요청은 "건물의 바닥지도 인 큰 PDF 파일이 있습니다."

    초기 요청은 "건물의 바닥지도 인 큰 PDF 파일이 있습니다."

    나는 이것이 당신이 짐작하는 것보다 더 어려울 수도 있다고 말하기를 두려워합니다.

    왜냐하면 마지막으로 알려진 모든 사람들이 pdf를 구문 분석하는 데 사용하는 lib가 smalot이기 때문에 큰 파일에 관한 문제가 발생하는 것으로 알려져 있습니다.

    여기에, PHP를 구문 분석 할 수있는 진짜 PHP 라이브러리를 찾고, "개발자"가 많이 필요로하는 메모리 제한을 없애기 위해 PHP 구성이 필요합니다 (필자는 그렇지 않다).

    smalot 성능에 대한 자세한 내용은이 게시물을 참조하십시오. https://github.com/smalot/pdfparser/issues/163

  6. from https://stackoverflow.com/questions/1004478/read-pdf-files-with-php by cc-by-sa and MIT license