将 Nvidia GPU 显存用作 Linux 交换空间:突破内存瓶颈的实用指南
探索如何将闲置的 GPU 显存用作 Linux 交换空间,突破 RAM 限制,提升性能。涵盖技术原理、实现步骤、配置优化及实战案例。
学习、工作与兴趣的记录
探索如何将闲置的 GPU 显存用作 Linux 交换空间,突破 RAM 限制,提升性能。涵盖技术原理、实现步骤、配置优化及实战案例。
1-Bit Bonsai 通过创新的 1-bit 权重量化技术,将图像生成模型压缩到仅 4B 参数,使其能在普通笔记本电脑上运行。本文深入解析其技术原理、实践方法和应用场景。
Rosalind 是一个用 Rust 编写的基因组学工具包,能够在普通笔记本电脑上运行全基因组分析流程。本文深入剖析其技术架构、性能优化技巧和实战应用,展示了如何通过 Rust 的内存安全和零成本抽象优势,让高性能基因组计算变得更加平民化。
深入探讨如何将 $80 的 RK3562 Android 平板通过 U-Boot 和主线 Linux 转换为功能完整的 Debian 工作站,包含详细的技术步骤、性能测试和常见问题解决方案。
SANA-WM 通过创新的时空解耦架构,用仅 2.6B 参数实现了 1 分钟 720p 视频生成,在开源视频生成模型中实现了最长的生成时长和最高的分辨率。
从 Termux 到 Google 原生虚拟机,全面解析 Android Linux 终端技术演进,包含实战代码示例和性能对比。
Linux 游戏性能为何超越 Windows?本文深入分析 Wine、Proton、VKD3D 等项目如何将 Windows API 转化为 Linux 内核特性,以及内核级优化带来的性能优势。
Needle 项目通过知识蒸馏技术,成功将 Gemini 的工具调用能力压缩到仅 26M 参数的小模型。这个创新使得在边缘设备、浏览器和移动应用中实现高效的 AI Agent 成为可能,大幅降低了部署成本和推理延迟。
DS4 是 Redis 作者 antirez 的新作,一个专为 Apple Silicon 优化的 DeepSeek 4 本地推理引擎。通过深度利用 Metal Performance Shaders,DS4 在 M2 Max 上实现了 58 tokens/s 的推理速度,远超同类工具。本文深入剖析其技术架构、量化策略、Metal 优化技巧,并提供完整的部署指南和实战代码示例。
DeepSeek 4 Flash (ds4) 是一个专为 Apple Silicon 优化的本地 LLM 推理引擎,由 Redis 创建者 antirez 开发。本文深入解析其 Metal 架构优化、性能基准、代码示例及实战应用场景,帮助开发者在 M4 芯片上实现高性能本地推理。
Zed 1.0 正式发布!这款由 Rust 编写的高性能代码编辑器带来了 GPU 加速渲染、原生协作功能和毫秒级启动时间。本文深入分析其技术架构、适用场景以及与其他编辑器的对比,帮助开发者了解是否值得尝试这个新工具。