Open Source

用LitData Viewer查看LitData数据内容

最近从WebDataset切换到LitData,LitData是PyTorch Lightning同公司开发的,刚发布的时候我就尝试过,当时bug比较多就放弃了。经过一年多的迭代,已经非常强大。而且它和PyTorch Lightning框架解耦,可以单独在任意训练/推理pipeline中使用。支持读取多种shards:LitData格式、HF Parquet格式、MosaicML格式,还可以通过StreamingRawDataset直接在原始数据上实现流式。

Commander One中文汉化优化

Commander One 官方自带的简体中文翻译质量不佳,部分文本的表述非常生硬且不符合中文用户的使用习惯。我使用Gemini 2.5 Pro创建了翻译更精准、更地道的中文语言包,以提升中文用户的日常使用体验。

notion-hugo-deploy:用Notion写博客、用Hugo发布

一直用 Notion 写博客,它的编辑体验的确非常好:支持丰富的文本格式,能随时随地编辑,团队协作也十分方便。不过,直接用 Notion 的公开页面(Public Pages)来发布博客,却有几个痛点:

Emacs VTerm.app

作为一个Emacs用户,最近Emacs用得越来越少,因为Visual Studio Code + GitHub Copilot越来越强。但是Terminal Emulator一直没有特别好的方案,之前用iTerm2,后来切换到Termius,最近发现Emacs VTerm功能也很全,完全可以当作独立的终端使用。

使用SketchyBar代替macOS菜单栏

我把macOS的“显示器具有单独空间”关掉后,系统菜单栏只留在主显示器顶端,副屏顶部空空如也,观感和可用性都不太好。于是配置了SketchyBar,在多个屏幕显示统一的顶栏,并添加了一些自定义组件。SketchyBar一般和yabai或aerospace窗口管理工具配合使用,我进行了一些开发,使其能单独正常工作。

开源音频编码器soundstream-light

SoundStream是Google提出的端到端神经音频压缩模型,能够以低码率获得高保真重建,适用于实时语音、在线会议与多媒体应用。我创建了一个开源项目soundstream-light,将精简的C++推理实现与官方TFLite模型整合,打包成Python模块和跨平台命令行工具。