之前我承诺会发一个同人音声脚本的帖,现在来填坑。会写这个程式是因为爬虫脚本每天都爬下1~10GB不等的作品,跟本没法都听完,想去芜存菁。
简单介绍这程式的作用,就是网站爬虫,下载,统一命名,选妃,转档,加封面,加Tag,汇入iTunes,建立播放清单都全自动化的一条龙服务。
在看这帖之前,先声明:如果你的系统不是OSX,完全不会shell script,甚至没用过command line,别轻易尝试。
如果没被吓走,就来GitHub
https://github.com/bandiaozimu/dj_voice_organize
为避免过多的爬虫对网站造成攻击,我没把爬虫脚本放在里面,若能发Pull requests作出任何有用的小修小改,我私下给。
另外,我开了三个issues,如果能解任一个,我送1.77TB的资料。
功能
- 整理作品统一档名,目录规则,重复的作品不删档并于档名后加“-1”“-2”以此类推。
- 建立资料库,纪录作品的发行社团,属性标签,声优。各作品下载数,每新增200次更新一次属性标签。
- 解压缩,转档,封面,id3 tag,汇入iTunes,一键完成。
- 配合Wunderlist建立推荐清单,可定制推荐机制。
- 可与JDownloader,FlexGet 对接,爬虫-下载-整理-筛选-汇入itunes全自动化。
- 配合Wunderlist的推播功能,可在下载完成推送通知,还可筛选推送的作品。
- 本程式支持主机/客户端的配置方式,即主机运行 FlexGet,JDownloader,及保存作品资料;
客户端运行解压缩,转档,封面,id3 tag,汇入iTunes。 - 本程式会将属性标签(调教/中出し/ナース…等) 嵌入id3 tag的“注解”中,方便iTues建立智慧播放清单。
环境
- 本程式目前只对OSX做过调适。
- 本程式需要以下perl 模组,都可在cpan上找到:
-
- Web::Query;
- JSON;
- Encode;
- DBI;
- Data::Dumper;
- File::Copy;
- File::Basename;
- File::Find ();
- File::chdir;
- Getopt::Std;
- List::Util qw( min max );
- DateTime;
-
- 本程式需要以下程式协同运行:
- atomicparsley
- eyeD3
- ffmpeg + fdk-aac
- sqlite
- gnu-sed
- realpath
- perl
- curl
琉璃神社★ACG.GY原创文章,转载请保留原文地址: https://hacg.icu/wp/61788.html
OSX……只用过windows和Ubuntu的我还是点个STAR就走吧……
买不起苹果的lowb 表示这肯定是大佬 那么我也只好告辞。。
其实linux只要改几个指令应该就能行,win10我看过有上bash的技术文,只是我手都上没那环境。
嗯,先去GitHub点个star先,以后有空再来踩坑
一脸懵逼。。
谢谢,大佬
大佬,能问一下百度网盘现在自动转存么?另外针对不同论坛混乱的文件名怎么获取tag呢。
还有各种论坛的验证和积分也是真麻烦呀。
怎么自动转存
找不用积分的呗。。
我的脚本是认RJ123456这样的代码,如果档名里没有,会略过。
感谢回复。
害怕
老哥们,求一部里番,说是有一群人就一个男的,去海边度假还是拍写真,男主应该有事离开了,后面有拍av的一群人是走错片场还是怎样强奸了女主们,男主后面回来看到这场景
从10年以来所有里番都没漏过的我表示对你的描述完全没有印象……
爬的是哪里的作品呢?
emmmm,不是我要成为伸手党,而是臣妾做不到啊
其实很怕伸手党,这种程式就是得低调才走得长久,用的人多死的快。我在发布前还把刷新的机制做过简化,生怕被dlSite发现。所以我有下个坎儿,不用看懂这类脚本,但至少得会安装,会用。
可以维护一个代理池去爬嘛应该比较安全
先点个star慢慢看是怎么回事。。
傻逼的我根本看不懂( ⑨_⑨?)
手都不知道往哪伸
以【爬虫脚本每天都爬下1~10GB不等的作品】推理出爬的是mikocon。那里的免空链接爆破速度特别快,而在下有hvdb账号,可否加telegram账号合作?
的确是mikocon,惭愧,免空爆破我肯定有份,所以我不敢把爬虫公开,连站名也不敢明讲。我刚注册了telegram:bandiaozi,聊聊。
图里居然有七色蔷薇!
图里的智慧播放列表我定的条件是【下载数超过4000且我还没听过的作品】,所以应该都不差。
所以…虽然很厉害但却看不懂…………
妈耶每天都爬不伤身吗pwp
想起某挂了的doujinvoice查询系统