PHP로 PDF 파일보기

빌딩의 층간지도 인 대형 PDF 파일이 있습니다. 그것은 좌석 위치의 텍스트 상자를 포함하여 모든 사무용 가구에 대한 레이어가 있습니다.

제 목표는 PHP로이 파일을 읽고, 텍스트 레이어를 찾기 위해 문서를 검색하고, 파일의 내용과 좌표를 가져 오는 것입니다. 이렇게하면 좌석 위치 -> x / y 좌표를 매핑 할 수 있습니다.

PHP를 통해이를 수행 할 수있는 방법이 있습니까? (또는 Ruby 나 Python이 필요한 경우)

해결법

==============================
1.FPDF (FPDI 포함) 확인 :

FPDF (FPDI 포함) 확인 :

http://www.fpdf.org/

http://www.setasign.de/products/pdf-php-solutions/fpdi/

이것들은 당신이 pdf를 열어 PHP에서 그 안에 내용을 추가하게합니다. 필요로하는 값에 대해 기존 콘텐츠를 검색하는 기능을 사용할 수도 있습니다.

또 다른 가능한 라이브러리는 TCPDF입니다. http://www.tecnick.com/public/code/cp_dpage.php?aiocp_dp=tcpdf

최신 라이브러리를 추가하려면 업데이트 : PDF Parser
==============================
2.PHP 라이브러리 (pdfparser)가 있습니다.

PHP 라이브러리 (pdfparser)가 있습니다.

프로젝트 웹 사이트

http://www.pdfparser.org/

기둥

https://github.com/smalot/pdfparser

하지만 ぱげ / 아피

http://www.pdfparser.org/demo

프로젝트에 pdfparser를 포함하면 mypdf.pdf에서 모든 텍스트를 다음과 같이 얻을 수 있습니다.
```
<?php
$parser = new \installpath\PdfParser\Parser();
$pdf    = $parser->parseFile('mypdf.pdf');  
$text = $pdf->getText();
echo $text;//all text from mypdf.pdf

?>
```
Simular를 사용하면 pdf에서 메타 데이터를 가져올 수있을뿐만 아니라 pdf 객체 (예 : 이미지)를 가져올 수 있습니다.
==============================
3.흠 ... 정확히 PHP는 아니지만, PHP에서 프로그램을 호출하여 pdf를 임시 html 파일로 변환 한 다음 결과 파일을 PHP로 구문 분석 할 수 있습니다. 나는 내 프로젝트와 비슷한 것을했는데 이것은 내가 사용했던 프로그램이다.

흠 ... 정확히 PHP는 아니지만, PHP에서 프로그램을 호출하여 pdf를 임시 html 파일로 변환 한 다음 결과 파일을 PHP로 구문 분석 할 수 있습니다. 나는 내 프로젝트와 비슷한 것을했는데 이것은 내가 사용했던 프로그램이다.

PdfToHtml

프로그램에서 멋진 점은 절대 위치 좌표를 사용하여
태그의 텍스트 요소를 뱉어내는 것입니다. 이것이 바로 당신이하려는 일인 것처럼 보입니다.
==============================
4.이 응용 프로그램 http://pdfbox.apache.org/을 사용해 볼 수도 있습니다. 실제 사례는 https://www.jinises.com에서 확인할 수 있습니다.

이 응용 프로그램 http://pdfbox.apache.org/을 사용해 볼 수도 있습니다. 실제 사례는 https://www.jinises.com에서 확인할 수 있습니다.
==============================
5.초기 요청은 "건물의 바닥지도 인 큰 PDF 파일이 있습니다."

초기 요청은 "건물의 바닥지도 인 큰 PDF 파일이 있습니다."

나는 이것이 당신이 짐작하는 것보다 더 어려울 수도 있다고 말하기를 두려워합니다.

왜냐하면 마지막으로 알려진 모든 사람들이 pdf를 구문 분석하는 데 사용하는 lib가 smalot이기 때문에 큰 파일에 관한 문제가 발생하는 것으로 알려져 있습니다.

여기에, PHP를 구문 분석 할 수있는 진짜 PHP 라이브러리를 찾고, "개발자"가 많이 필요로하는 메모리 제한을 없애기 위해 PHP 구성이 필요합니다 (필자는 그렇지 않다).

smalot 성능에 대한 자세한 내용은이 게시물을 참조하십시오. https://github.com/smalot/pdfparser/issues/163

from https://stackoverflow.com/questions/1004478/read-pdf-files-with-php by cc-by-sa and MIT license

'PHP' 카테고리의 다른 글

PHP ini file_get_contents 외부 URL (0)	2018.09.13
PHP에서 이미지 출력하기 (0)	2018.09.13
PHP에서는 디렉토리 탐색을 방지하지만 경로는 허용합니다. (0)	2018.09.12
PHP에서 연관 배열 정렬 [duplicate] (0)	2018.09.12
주어진 날짜와 오늘 비교 (0)	2018.09.12

복붙노트

PHP로 PDF 파일보기

PHP로 PDF 파일보기

해결법

1.FPDF (FPDI 포함) 확인 :

2.PHP 라이브러리 (pdfparser)가 있습니다.

3.흠 ... 정확히 PHP는 아니지만, PHP에서 프로그램을 호출하여 pdf를 임시 html 파일로 변환 한 다음 결과 파일을 PHP로 구문 분석 할 수 있습니다. 나는 내 프로젝트와 비슷한 것을했는데 이것은 내가 사용했던 프로그램이다.

4.이 응용 프로그램 http://pdfbox.apache.org/을 사용해 볼 수도 있습니다. 실제 사례는 https://www.jinises.com에서 확인할 수 있습니다.

5.초기 요청은 "건물의 바닥지도 인 큰 PDF 파일이 있습니다."

'PHP' 카테고리의 다른 글

티스토리툴바