개발/Python
파이썬 py 파일 exe 로 변환 방법
코드를 전부 짜고 py 파일을 이제 다른사람들(windows)이 사용하기 위해서 exe 파일로 변환하기 위해서는 pyinstaller 를 이용하면 간단하게 가능합니다. 전제 조건으로는 파이썬이 설치가 되어있어야 합니다! 0. 파이썬 설치 https://www.python.org/downloads/ Download Python The official home of the Python Programming Language www.python.org 1. CMD 창에서 아래와 같이 pyinstaller 설치 명령어를 실행합니다. pip install pyinstaller 저는 이미 설치가 되어있는 상태로 아래와 같이 나오지만, 실제로는 설치 진행률이 나오며 설치가 될 것 입니다. 2. py파일이 있는 디렉토리..
파이썬 PDF 파일 내 텍스트를 파일명으로 변경
PDF 가 위치한 디렉토리를 설정하고, 위치에 pdf 파일을 떨궈줍니다. pdf 에 위치한 파일이 파일 내 인덱스에 위치한 텍스트를 인식하여 파일이름으로 변경하는 작업입니다. import PyPDF2 import os # 페이지 인덱스 설정 def extract_text_from_page(pdf_path, page_number, start_index, end_index): text = '' with open(pdf_path, 'rb') as file: reader = PyPDF2.PdfReader(file) page = reader.pages[page_number - 1] # 페이지 인덱스는 0부터 시작하므로 1을 빼줍니다. page_text = page.extract_text() text += page..
파이참 라이선스 만료, 학생 무료 갱신
파이참을 오랜만에 방문했더니, 라이선스가 만료되었다는 알랏이 떴습니다. 파이참에는 두가지 버전이 있습니다. Professional [유료] 와 Community Edition [무료] 로 나눠집니다. 저는 데이터베이스를 연결해서 사용했으므로, 프로페셔널을 다운로드 받았었습니다. 학생의 경우 상업목적이 아닌경우 Professional [유료]를 무료로 사용가능합니다. Enter License 를 눌러 연장하는 방법을 알아봅시다. (라이선스 1년 단위 만료) 우선 파이참에 로그인 되어있는 계정 확인하여, JET BRAINS 에 접속하여, 하단에 Apply for a free student or teacher license 를 클릭합니다. 하단을 조금 내려서 Apply now 를 눌러줍니다 인적사항 및 이..
Mongodb 기초 - pymongo
#DB 연결에 필요한 부분 from pymongo import MongoClient client = MongoClient('mongodb://DB계정:계정 패스워드@IP주소:27017') db = client.dbtest #사용할 DB 명 (dbtest로 진행) # users라는 Table에 저장 # 저장 - 예시 doc = {'name':'bobby','age':21} db.users.insert_one(doc) # 한 개 찾기 - 예시 user = db.users.find_one({'name':'bobby'}) # 여러개 찾기 - 예시 ( _id 값은 제외하고 출력) same_ages = list(db.users.find({'age':21},{'_id':False})) # 바꾸기 - 예시 db.use..
웹 크롤링 기초2 - DB연결 및 insert
웹크롤링으로 원하는 데이터를 가져오는 것을 저번에 진행했다면 요번엔 가져온 데이터를 Database (Mongo DB) 에 넣도록 하겠습니다. 우선 웹크롤링으로 데이터추출하는 방법은 아래 URL 참고 부탁드립니다. 2022.05.18 - [개발/Python] - 웹 크롤링 기초1 웹 크롤링 기초1 크롤링이란 Web상에 내용 중 필요한 데이터만 추출하는 방법을 의미합니다. 파이썬으로 진행하였고 네이버 영화 사이트내 영화 제목을 크롤링 해보겠습니다. 우선 bs 4(BeautifulSoup), requests 패키지 myit.tistory.com 사전에 Mongodb는 27017 Port를 사용하므로 방화벽을 여는 사전 작업이 필요합니다. 환경 : pycharm, MAC OS, Robo 3T, Mongodb ..
웹 크롤링 기초1
크롤링이란 Web상에 내용 중 필요한 데이터만 추출하는 방법을 의미합니다. 파이썬으로 진행하였고 네이버 영화 사이트내 영화 제목을 크롤링 해보겠습니다. 우선 bs 4(BeautifulSoup), requests 패키지를 설치 합니다. 환경 : PyCharm , Mac 사용 크롤링 기본 문법은 아래와 같습니다. 크롤링시 무조건적으로 들어간다고 생각하시면 되겠습니다. 여기서 주의할 점은 크롤링을 원하는 대상의 url을 적어주셔야합니다. #크롤링 기본 문법 (무조건 들어감) import requests from bs4 import BeautifulSoup # 타겟 URL을 읽어서 HTML를 받아오고 (저는 네이버 영화 URL로 지정하였습니다.) headers = {'User-Agent' : 'Mozilla/5..