본문 바로가기

📂 Engineering83

파이썬 자연어 처리 패키지 rhinoMorph import rhinoMorph rn = startRhino()# 라이노 사전 객체를 불러와 rn에 저장합니다. # 이 사전을 기반으로 형태소를 분석합니다. rhinoMorph.onlyMorph_list( rn, text, *args) # 형태소(morphemes)만 processed_text에 list 형식으로 반환해줍니다. # 본인이 원하는 품사만 골라주는 pos, # 어미를 결합해주는 eomi=True, 연결된 명사를 결합해주는 combineN=True 등의 arguments가 있습니다. # 동사의 경우 뒤에 '하'를 결합해주는 xrVv=True # 연결된 명사를 결합해주는 combineN=True 등의 arguments가 있습니다. rhinoMorph.onlyMorph_list(rn, text, .. 2020. 7. 10.
OS, xlrd, openpyxl,예외처리 1 디렉토리 관리 # 현재 작업 디렉토리 반환 os.getcwd() os.chdir("어쩌구") - 어쩌구 디렉토리로 이동 os.listdir("어쩌구") - 어쩌구 폴더 내의 모든 파일과 폴더 목록을 반환함 os.path.exists("C:\어쩌구\저쩌구") - 입력한 경로(폴더, 디렉토리)가 존재하면 True, 없으면 False os.mkdir("C:\python\python2") - 입력한 경로 제일 마지막 폴더를 생성 (이 경우에는 python2가 생성) os.makedirs("C:\python\python2") - 입력한 경로 모두 생성함 (python, python2 폴더 모두 생성) os.rmdir() / os.removedirs() - mkdir의 반대 삭제해주는데 개발자들 삭제하는거 무서.. 2020. 7. 8.
R 다운 받는 곳 r 다운 받는 곳: https://cran.r-project.org/bin/windows/base/ Download R-3.6.3 for Windows. The R-project for statistical computing. If you want to double-check that the package you have downloaded matches the package distributed by CRAN, you can compare the md5sum of the .exe to the fingerprint on the master server. You will need a version of md5sum for windows: both graphical and comm cran.r-project.. 2020. 4. 22.
itertools - cycle cycle - 순환가능 객체 요소의 반복 생성 zip을 할 때 한 리스트의 elements 수가 다른 것보다 작다고 하면, 1,2,1,2,1,2,1,2,1,2,... 이렇게 다른 리스트의 원소 수에 맞춰 계속 쓰는 것이 아니라 itertools.cycle([1,2]) 이렇게 쓰면 훨씬 간단히 표현할 수 있다. 입력 예시) import itertools lst1 = ["가", "나", "다"] lst2 = [1, 2, 3, 4, 5, 6, 7, 8, 9] for item1, item2 in zip(itertools.cycle(lst1), lst2): print(item1, item2) 결과물) 가 1 나 2 다 3 가 4 나 5 다 6 가 7 나 8 다 9 설명)가나다는 3개 뿐이지만 cycle덕에 가나다.. 2020. 4. 17.