PDF转Markdown和个人的碎碎念

本文是我个人的碎碎念,记录一下最近的软件折腾。

这一年,我更新的频率降低了,主要是因为工作后比较少折腾了,另外就是Obsidian的工作流已经固定,基本就是ob和zotero的配合,使用A佬的插件Zotlit。但Zotlit插件目前还没适配最新的Electron平台,没跟上最新的ob更新,所以我的ob安装程序版本还在1.6.3上。这种不适配也让我有点焦虑,也在考虑寻找其他合适的插件。

这几天折腾了PDF转Markdown的方案,主要是最近看到有用AI去辅助读取PDF形成md格式,尝试了gptpdf,但部署没有成功。今天找到了doc2x( https://doc2x.noedgeai.com/?inviteCode=1UNNQ0 )体验后感觉不错。可以考虑的一个英文文献工作流是:下载PDF,用doc2x转为md,然后用沉浸式翻译( https://app.immersivetranslate.com/markdown/ )翻译成双语md,然后放入ob中,或者用于后续AI学习和挖掘。

最近,也终于上手折腾了一次本地的AI大模型,使用的是[[Ollama]]来运行Gemma2的9b模型,配置过程还算顺利,但因为我笔记本的配置原因,运行起来太卡了。我的笔记本的CPU是R7-8845H,只有核显R-780M,一旦运行,直接跑满我的32G内存,CPU的占用也飙高。这电脑是我今年刚换的,当时以为32G内存已经足够(上一台是16G),但现在日常开启软件后内存的占用已经有19G了。目前来看本地运行大模型的成本还是很高,对于普通的用户还不是很推荐(怀疑现在大火的AI PC真的能优化那么多吗),尽量还是云计算吧。

618买了两件电子产品,一件是上面说的Windows笔记本,用来一个月还是挺满意的,续航勉强能达到我的要求吧,在极其省电的情况下(省电模型,屏幕刷新率调成48hz,亮度降低中下),只看文献和写稿能达到6-7小时。另一件是威联通的NAS,解决了我的存储焦虑,但硬盘最近又涨价了,买不起。此外,学习了Docker,这对想折腾IT的普通用户是一项不错的技能。要学的网络知识也莫名增加,内网穿透折腾了[[Tailscale]]、[[节点小宝]],最后还是部署了[[ZeroTier]]。这里也点名批评绿联,辜负了我的期盼,618推出的NAS DXP4800还没达到用户的预期,在京东上第一次看到一个新品的好评率居然只有40%,幸好最后退货和补偿还是满意的。然后24年7月绿联上市了。

最后,祝我自己生日快乐,愿在新的一年继续折腾,不断探索。