PHP로 PDF 파일보기
PHPPHP로 PDF 파일보기
빌딩의 층간지도 인 대형 PDF 파일이 있습니다. 그것은 좌석 위치의 텍스트 상자를 포함하여 모든 사무용 가구에 대한 레이어가 있습니다.
제 목표는 PHP로이 파일을 읽고, 텍스트 레이어를 찾기 위해 문서를 검색하고, 파일의 내용과 좌표를 가져 오는 것입니다. 이렇게하면 좌석 위치 -> x / y 좌표를 매핑 할 수 있습니다.
PHP를 통해이를 수행 할 수있는 방법이 있습니까? (또는 Ruby 나 Python이 필요한 경우)
해결법
-
==============================
1.FPDF (FPDI 포함) 확인 :
FPDF (FPDI 포함) 확인 :
http://www.fpdf.org/
http://www.setasign.de/products/pdf-php-solutions/fpdi/
이것들은 당신이 pdf를 열어 PHP에서 그 안에 내용을 추가하게합니다. 필요로하는 값에 대해 기존 콘텐츠를 검색하는 기능을 사용할 수도 있습니다.
또 다른 가능한 라이브러리는 TCPDF입니다. http://www.tecnick.com/public/code/cp_dpage.php?aiocp_dp=tcpdf
최신 라이브러리를 추가하려면 업데이트 : PDF Parser
-
==============================
2.PHP 라이브러리 (pdfparser)가 있습니다.
PHP 라이브러리 (pdfparser)가 있습니다.
프로젝트 웹 사이트
http://www.pdfparser.org/
기둥
https://github.com/smalot/pdfparser
하지만 ぱげ / 아피
http://www.pdfparser.org/demo
프로젝트에 pdfparser를 포함하면 mypdf.pdf에서 모든 텍스트를 다음과 같이 얻을 수 있습니다.
<?php $parser = new \installpath\PdfParser\Parser(); $pdf = $parser->parseFile('mypdf.pdf'); $text = $pdf->getText(); echo $text;//all text from mypdf.pdf ?>
Simular를 사용하면 pdf에서 메타 데이터를 가져올 수있을뿐만 아니라 pdf 객체 (예 : 이미지)를 가져올 수 있습니다.
-
==============================
3.흠 ... 정확히 PHP는 아니지만, PHP에서 프로그램을 호출하여 pdf를 임시 html 파일로 변환 한 다음 결과 파일을 PHP로 구문 분석 할 수 있습니다. 나는 내 프로젝트와 비슷한 것을했는데 이것은 내가 사용했던 프로그램이다.
흠 ... 정확히 PHP는 아니지만, PHP에서 프로그램을 호출하여 pdf를 임시 html 파일로 변환 한 다음 결과 파일을 PHP로 구문 분석 할 수 있습니다. 나는 내 프로젝트와 비슷한 것을했는데 이것은 내가 사용했던 프로그램이다.
PdfToHtml
프로그램에서 멋진 점은 절대 위치 좌표를 사용하여
태그의 텍스트 요소를 뱉어내는 것입니다. 이것이 바로 당신이하려는 일인 것처럼 보입니다.==============================4.이 응용 프로그램 http://pdfbox.apache.org/을 사용해 볼 수도 있습니다. 실제 사례는 https://www.jinises.com에서 확인할 수 있습니다.
이 응용 프로그램 http://pdfbox.apache.org/을 사용해 볼 수도 있습니다. 실제 사례는 https://www.jinises.com에서 확인할 수 있습니다.
==============================5.초기 요청은 "건물의 바닥지도 인 큰 PDF 파일이 있습니다."
초기 요청은 "건물의 바닥지도 인 큰 PDF 파일이 있습니다."
나는 이것이 당신이 짐작하는 것보다 더 어려울 수도 있다고 말하기를 두려워합니다.
왜냐하면 마지막으로 알려진 모든 사람들이 pdf를 구문 분석하는 데 사용하는 lib가 smalot이기 때문에 큰 파일에 관한 문제가 발생하는 것으로 알려져 있습니다.
여기에, PHP를 구문 분석 할 수있는 진짜 PHP 라이브러리를 찾고, "개발자"가 많이 필요로하는 메모리 제한을 없애기 위해 PHP 구성이 필요합니다 (필자는 그렇지 않다).
smalot 성능에 대한 자세한 내용은이 게시물을 참조하십시오. https://github.com/smalot/pdfparser/issues/163
from https://stackoverflow.com/questions/1004478/read-pdf-files-with-php by cc-by-sa and MIT license
'PHP' 카테고리의 다른 글
PHP ini file_get_contents 외부 URL (0) 2018.09.13 PHP에서 이미지 출력하기 (0) 2018.09.13 PHP에서는 디렉토리 탐색을 방지하지만 경로는 허용합니다. (0) 2018.09.12 PHP에서 연관 배열 정렬 [duplicate] (0) 2018.09.12 주어진 날짜와 오늘 비교 (0) 2018.09.12