from pdfminer.pdfinterp import PDFResourceManager, process_pdf
from pdfminer.converter import TextConverter
from pdfminer.layout import LAParams
from io import StringIO
from io import open
from urllib.request import urlopen
# 다음 코드는 라이브러리에서 PDF 파일을 읽을 시 사용하는 전형적인 코드 형태이므로, 필요할 때 활용하면 됨
def read_pdf_file(pdfFile):
rsrcmgr = PDFResourceManager()
retstr = StringIO()
laparams = LAParams()
device = TextConverter(rsrcmgr, retstr, laparams=laparams)
process_pdf(rsrcmgr, device, pdfFile)
device.close()
content = retstr.getvalue()
retstr.close()
return content
# pdf_file = urlopen("http://pythonscraping.com/pages/warandpeace/chapter1.pdf") # 웹에 있는 pdf 파일을 읽을 수 있음
pdf_file = open("03_data/sample.pdf", "rb") # 로컬 PC에 있는 pdf 파일도 읽을 수 있음
contents = read_pdf_file(pdf_file)
print(contents)
pdf_file.close()
퇴사학교–넓고 얕은 IT코딩스쿨 by 잔재미코딩 (본 자료는 다양한 인터넷 자료를 요약, 정리한 자료입니다.) PHP 출력문 기본 형태 sample.php 소스가 웹부라우저 화면에 출력되기까지의 과정을 살펴보자. 이것은 html 태그 내에 php 코드가 어떤 식으로 삽입되는지를 보여 주기 위한 예이다. 위 예에서 sample.php 원본소스 코드를 살펴보면 아래와 같은 일정한 규칙을 찾을 수 있다. - // 으로 시작되는 라인은 주석문으로 출력에 아무 영향을 주지 않는다. - $text 와 같이 $ 로 시작되는 단어는 어떤 값을 저장하는 '변수' 이다. - php 코드는 <? 와 ?>