写在前面:只支持Mac (intel mac不知道行不行)
【资料图】
由于个人的一些需求,在网上查找了各种把内嵌字幕转成SRT的方法,发现步骤繁琐或者就是OCR功能需要花钱。最后发现苹果自带的API可以进行OCR,然后就自己写了个软件来完成我想要的。
先放上地址:/shibotong/SRTScraper
目前还没打包因为好像是设置的问题,打包之后每次打开视频文件就崩溃。希望有大佬可以帮忙解决这个问题。
接下来我总结一下我的实现方法
对于视频每秒截图一次,记录截图的时间
对于每张图截取字幕部分(红框)
由于苹果自带的Vision API太强了,如果使用整张图片进行OCR的话就会出现所有的文字,所以自己写用SwiftUI写了个框/shibotong/ResizableRectangle。
对于截取后的图片进行OCR。
把重复文字的图片的时间拼到一起就可以了
这里在网上抄了一个String distance的方法来查看和上一段文字的相似度。因为就算是同一句话,两张截图OCR之后的文字也不一定完全一样。
然后导出到本地就可以了。
这个还有很多不完善的地方,比如说不能选取视频的某段时间来进行识别,不能中途停止,识别完之后不能修改只能倒导出。我是后期用aegisub来进行细修。
目前只能用Xcode打开然后build来用,不知道有没有大佬知道打包之后如何才能打开视频文件
标签:
Copyright © 2015-2022 南非空调网版权所有 备案号:沪ICP备2022005074号-13 联系邮箱:58 55 97 3@qq.com