파다 평범일상

파이썬 HTML 태그 크롤링 프로젝트, 유튜브 동영상 태그 가져오기 (2) 본문

컴퓨터 IT/얕은 컴퓨터 지식과 프로그래밍

파이썬 HTML 태그 크롤링 프로젝트, 유튜브 동영상 태그 가져오기 (2)

파다 평범일상 2024. 5. 19. 11:32
반응형

 

프로젝트 요약

파이썬으로 작성된 스크립트를 사용하여, YouTube에 업로드된 동영상의 제목, 상세내용, 태그, 해시태그 가져오기

  1. 파이썬 스크립트를 실행할때 태그를 얻고오고 싶은 동영상의 링크를 매개변수로 전달한다.
  2. 파이썬 스크립트에서 웹 HTML 크롤링을 하여 YouTube 정보를 가져온다.
  3. 콘솔에 동영상의 제목, 상세내용, 태그, 해시테크를 출력한다.

해당 글 요약

  1. 프로젝트에서 사용할 모듈 그려보기
  2. main.py에 전부 구현하고 나중에 나누기

프로젝트에서 사용할 모듈 생각하기

Input Module

  1. 파이썬 스크립트를 실행할때 전달받은 매개변수의 갯수가 1개인지 판단한다.
  2. 파이썬 스크립트를 실행할때 전달받은 매개변수가 Youtube 링크인지 판단한다.

Parse Module

  1. 동영상에 설정된 태그를 확인하고 리스트를 반환한다.
    • 태그가 없다면 비어있는 리스트를 반환한다.
    • 태그가 있다면 있는대로 리스트에 담아 반환한다.

Output Module

  1. Parse Module로부터 전달받은 리스트를 화면상에 출력한다.
    • 비어있는 리스트를 전달받았다면, 출력할 태그가 없다고 출력한다.
    • 데이터가 있는 리스트를 전달받았다면, 콤마(",")로 연결된 텍스트를 출력한다.
      • e.g) youtube,korea,friend,vlog

프로젝트 순서도 (Floe Chart)

순서도를 이렇게 그리는게 맞는지 모르겠지만 우선은 생각나는데로 그려본다. 각 모듈이 하는 일들은 위에서 작성한데로

모듈화 및 함수화는 나중에 하자

파이썬이 처음이기 때문에 문법 및 사용법을 몰라서 이것저것 하기에는 너무 어려울것 같다.

main.py 에서 전체적인 기능을 구현하고 나중에 모듈화 및 함수화 진행 예정. 그때면 위의 모듈이나 순서도는 새로운것으로 업데이트 되겠지.

Comments