이전 글에서는 music-dl 프로젝트를 시작하게 된 이유를 아주 길게 설명했다.
이번에는 프로젝트의 구성과 점진적으로 개선한 과정을 설명하는 글을 써보려고 한다.
이 글은 더 나은 음악감상을 위해 나처럼 헤매는 사람들이 시도해볼 수 있게 하는 목적으로 최대한 친절하게 써보려고 노력했다. 프로그래밍 경험이 있으신 분들이라면 그리 어렵지 않게 할 수 있을 정도로 간단한 프로젝트이긴 하다.
내가 가장 처음에 했던 방법은 youtube-dl --list-formats https://www.youtube.com/watch\?v=[VIDEOID]
로 다운로드 가능한 포맷을 알아보는 거였다.
다음과 같은 결과물을 얻을 수 있다.
1 |
|
오디오파일을 원하는 경우에는 format code가 251인 webm형식을 이용하면 된다.
youtube-dl -f 251 https://www.youtube.com/watch\?v=[VIDEOID]
를 실행하면 VIDEOID에 해당하는 영상을 지정한 포맷으로 다운로드할 수 있다.
하지만 이 과정 이후에 webm 형식의 파일을 mp3로 변환하는 추가적인 작업이 필요하다.
그리고 이 방법은 한개의 영상에 대해서만 가능하다. 플레이리스트에 있는 몇백개의 영상을 다운받기 위해서는 다른 방법이 필요하다.
youtube-dl은 플레이리스트를 지정해서 플레이리스트 전체를 다운로드할 수 있는 옵션을 지원한다.
그리고 특정 포맷을 지정하지 않고도 오디오파일로 다운로드하는 옵션과 webm을 mp3로 변환해주는 옵션도 있다.
플레이리스트별로 다운받으려면 각각의 디렉토리 지정이 필요하다. 파일명 포맷을 지정하는 옵션도 있어서 이러한 옵션들을 이용하면 다음과 같이 개선할 수 있다.
youtube-dl --extract-audio --audio-format mp3 -o "playlist1/%(title)s.%(ext)s" https://www.youtube.com/playlist\?list\=[PLAYLISTID]
플레이리스트 저장기능을 이대로 쓰면 노래를 한 곡만 추가해도 다음번엔 모든 노래를 다시 다운로드받는 문제가 있다.
youtube-dl에서 지원하는 --download-archive 옵션을 이용하면 새로 추가된 노래만 다운받을 수 있다.
youtube-dl --extract-audio --audio-format mp3 --download-archive downloaded_file.txt -o "playlist1/%(title)s.%(ext)s" https://www.youtube.com/playlist\?list\=[PLAYLISTID]
downloaded_file.txt 파일에는 다운받은 video_id들이 추가된다.
이 커맨드를 플레이리스트에 노래를 추가할 때마다 실행할 수 없으니, 일정시간마다 반복하기 위해서 cron job을 이용했다.
crontab -e
을 실행하고 0 1 * * * /path/command.sh
와 같은 형식으로 cronjob을 등록했다.
매일 새벽 1시에 /path/command.sh
를 실행한다는 의미이다. cronjob의 시간 형식은 정말 다양하기 때문에 한번쯤 찾아보는걸 추천한다.
이제 매일매일 자동으로 내 플레이리스트에 추가된 노래를 지정된 디렉토리에 다운받을 수 있다. nPlayer같은 FTP를 지원하는 미디어플레이어 등을 이용해 서버와 연결해서 노래를 들을 수 있다. 개선의 여지가 많지만 일단은 한동안 이 방법에 큰 불편함 없이 잘 사용했다.
이 방법에서 큰 불편함을 느낀 계기는 플레이리스트에 있는 영상 중 하나가 어떤 이유 때문에 접근이 안됐었다. 저작권 이슈였던가 해당 국가에서 차단됐던가 둘 중 하나였을 것이다. 그런데 새로 추가한 노래가 다운로드되지 않는다는 걸 한참 뒤에야 알게 되었고, 중간에 어떤 영상에서 다운로드가 실패했을 때 abort되는걸 그때 알게 되었다.
이 방법은 에러처리와 로깅이 제한적이라고 생각돼서 youtube-dl 이라는 커맨드 툴에 의존하지 않는 방법을 찾아보았다.
youtube-dl은 커맨드라인 툴로 배포되는 프로젝트였고, 코어는 python이었다. 다행히 Python 패키지로도 제공하고 있었고 이 패키지를 이용한 Python 프로젝트를 시작해야겠다고 마음먹었다. Python으로 만들면 --download-archive 옵션으로 파일에 video_id를 추가하는 방식을 DB에 새 row를 추가하는 방식으로 개선할 수 있겠단 생각이 들었다.
youtube-dl github repo에 있는 python 예제들을 참고하며 프로젝트를 시작했다. 프로젝트의 과정은 다음과 같다.
cmd로 지정했던 옵션들을 ydl_opts
에 설정하고 플레이리스트 URL을 전달해서 플레이리스트에 포함된 영상들의 video_id를 가져온다.
DB에 저장된 video_id들과 비교하며 새로 추가된 video_id를 리스트에 추가한다.
ydl.download()
의 인자로 리스트를 넘기고 다운로드받는다.
다운로드가 완료되면 DB에 video_id를 새로 추가한다.
Documentation만 잘 찾아보면 큰 어려움 없이 구현할 수 있는 프로젝트였다. 나름 만족스러운 작업이었지만 Python으로 짜고나니 개선할 여지가 더 많이 보였다.
플레이리스트별로 Thread Worker를 만드는 코드와 특정 영상에서 다운로드가 실패할때 에러처리를 하는 코드도 추가했다.
현재는 등록된 모든 플레이리스트(예를들면 Pop, Rock, Piano 등등…)를 매번 조회한다. Pop 플레이리스트에 노래를 하나 추가하더라도 모든 플레이리스트를 조회하는게 비효율적이라고 느꼈다. 해결 방법으로는 simple_term_menu
를 이용해 cmd에서 특정 플레이리스트를 선택하는 기능을 구현 중이다.
이것 말고도 개선할 점이 아직 너무 많은 프로젝트이다. 그래서 더 재밌고 손이 자주가는 것 같다.