2025年4月7日,小書痴的下剋上中文小說堂堂推出最後一集。
這部作品是從2021年暑假開始看,然後一路追到現在。
伴了我近4年的光陰,在此特別祝賀一下。
2025年4月7日 星期一
2025年4月4日 星期五
使用OpenAI的whisper進行逐字稿的產生
最近這兩週私人的時間大都被AI給佔了
尤其是玩到ollama+gemma3後,花了不少時間測試
這週又玩了新的東西,雖然對很多人來說是舊的東西了
那就是OpenAI於2022年就開源放出來的Whisper語音轉文字AI模型
目前最新的免費版本是2024的Turbo版
https://github.com/openai/whisper/blob/main/model-card.md
這東西最早我是在podman的AI lab裡看到的
因為第一時間想不到對我的用途在哪裡,所以就沒有試著去玩玩看
後來又在討論區中看到網友提起
說Whisper用來做逐字稿很好用
雖然我幾乎碰不到生逐字稿的情況,但先學著怎麼用也不錯
說不定有天需要用上時,能幫我省下許多寶貴的時間
就開始學著怎麼使用
2025年3月26日 星期三
使用Ollama+最新的Gemma3模型
搞完後Podman Desktop與Mtranserver應用後
很難不注意到Podman Desktop還有個AI Lab功能
可是使用之後,其效能沒有很好
說實話就是太慢到超出我容忍的限度
看來這應該是桌機與高階顯卡才能跑吧
正當測試不出我要的速度與效果,要放棄跑離線模型時
就這麼剛好,因為這陣子Google發表了最新開源的Gemma3
就看到有網友討論到ollama這軟體也有Gemma3可以用了
ollama?又是沒聽過的東西
於是就抽空研究了一下ollama這軟體
發現支援的模型還真不少,網路上中文說明也多
就試著使用看看
用完之後的簡單結論,這就是我要的離線AI應用啊
2025年3月20日 星期四
使用Podman Desktop架設Mtranserver離線翻譯服務
在討論區看到網友推薦SakuraLLM可以離線跑翻譯時
就興起了要在工作用的筆電上弄個離線翻譯系統的念頭
然後找著找著就看到Mtranserver這個應用
https://github.com/xxnuo/MTranServer
看來非常的輕量化,決定要來試試
上面要搭配Docker Desktop使用,就抓Docker Desktop下來安裝
裝完要啟用時,出現使用條款提示,其中一個條款:
員工超過250人以上或年營業額千萬以上公司要付費
商用要付費的話,那...換其它的替代軟體吧
趕快移除掉Docker desktop後,替代品很快就找到了,就是Podman desktop
可是這兩個是不同的軟體,雖說應用與指令的同質性很高
但還是有點不同,加上根本沒碰過這種「容器管理」的應用
花了一兩天才搞懂,但只搞懂應用,設定上還是似懂非懂
最後靠著新的AI「Grok」問到了正確的設定與解說,才正式完成
以下就詳述一下遇到的問題與該如何設定吧
2025年3月17日 星期一
2025年3月10日 星期一
2025年3月2日 星期日
EPUB 3.3版浮動版面直式格式製作-含字型內嵌
本來沒有要搞文字書籍這邊的啦
不過上次搞EPUB 3.0版固定配置圖片格式時
還是有參照其它各版格式來抓規律(要我慢慢看規格文件實在有點痛苦)
所以也是略有了解的程度
然後剛好最近手上有一批資料適合拿來轉檔看看
手癢就花了點時間實作一下
順便寫下這篇做一下筆記,做為未來要用時可以快速參考的依據
我用EPUB 3.3的範例來修改與細部說明
這篇是收錄台灣文學之父賴和的作品,一桿稱仔
https://github.com/dpublishing/epub-specs-tc/tree/master/epub33/EPUB 3.3範本
內容不但是直式文字的右翻書
而且有封面,有目錄索引,有分檔案(這個後面解釋),有插圖,有超連結
一本電子書該有的基本都有了
要擴充製作,拿這個來參考真的很夠了
以下就慢慢講解