All Stories

GPUs: 高性能矩阵乘法内核的解剖学

本文深入探讨了 NVIDIA GPU 在矩阵乘法(matmul)方面的核心硬件概念和编程技术。文章首先介绍了 NVIDIA GPU 架构的各个方面,包括全局内存、共享内存、L1/L2 缓存等,并解释了功率限制对性能的影响。接着,文章详细介绍了 GPU 汇编语言(SASS 和 PTX),以及如何使用这些语言来编写高效的 GPU 核心代码。文章重点介绍了两种设计...

Sep 29, 2025

DeepSeek-v3.2-Exp

内容提到了一个名为 DeepSeek-V3.2-Exp 的项目,可能是关于深度学习或人工智能的某个实验或研究版本。同时,提到了无法执行某个操作,但没有提供具体操作的上下文。

Sep 29, 2025

Claude Sonnet 4.5

Claude Sonnet 4.5 是目前世界上最强大的编码模型,具有构建复杂智能体、使用计算机以及推理和数学方面的显著优势。该模型已广泛应用于各种任务,包括软件开发、安全分析、金融分析等。Claude Sonnet 4.5 还带来了多项新功能,如代码检查点、改进的终端界面和 VS Code 扩展等。此外,Claude Sonnet 4.5 还推出了 Cla...

Sep 29, 2025

90%

本文探讨了人工智能(AI)在软件开发中的应用,作者通过实际项目经验分享了AI在编写代码中的运用情况。作者认为,AI已经能够编写超过90%的代码,并预测未来AI将承担更多编程任务。文章详细介绍了作者如何利用AI进行系统设计、数据库操作、API生成等环节,并分析了AI在编写代码中的优势和局限性。作者强调,尽管AI可以大幅提高开发效率,但开发者仍需具备良好的工程能...

Sep 29, 2025

引领订阅制互联网的脱衣舞女

本文讲述了Danni Ashe,一位脱衣舞女,如何成为互联网订阅模式的先驱。她通过建立个人网站Danni’s Hard Drive,并采用订阅模式,通过提供独家照片、访谈和互动内容,成功吸引了大量订阅者并赚取了巨额利润。她的成功为后来的互联网订阅模式奠定了基础,并对许多内容创作者和媒体公司产生了深远的影响。尽管她的成就被广泛认可,但Danni Ashe本人却...

Sep 28, 2025

这款开源打印机是一款基于Raspberry Pi Zero W的打印机

巴黎的Open Tools公司计划推出一款具有独特功能的喷墨打印机:它可以在连续的纸张卷上打印,并自动裁剪到所需尺寸,且整个打印机是开源的,除了现成的打印头和墨盒。这款名为Open Printer的开源、可维修的喷墨打印机专为制造商、艺术家以及厌倦了一次性硬件的人士设计。它采用标准机械组件和模块化部件,易于组装、修改和维修。用户可以选择在标准纸张或纸卷上打印...

Sep 28, 2025

为什么今天的人形机器人无法学习灵巧

本文探讨了为什么当前的人形机器人无法学会灵巧操作,尽管有数百万甚至数十亿美元的风险投资和科技公司投入用于其训练。文章首先回顾了人形机器人技术的发展历程,指出虽然研究者们已经在此领域投入了数十年的努力,但人形机器人的灵巧操作仍然是一个难题。作者认为,现有的基于视觉数据的学习方法无法有效地解决灵巧操作问题,因为人类灵巧操作依赖于丰富的触觉感知和力量感知,而这些感...

Sep 27, 2025

MycoToilet:基于菌丝的堆肥厕所演示

该内容介绍了由UBC应用科学学院的Joseph Dahmen教授、UBC植物园的研究经理Daniel Mosquin、微生物与免疫学系的Steven Hallam教授、McGill大学化学工程系加拿大研究主席Chris Moraes、SALA的Lorena Polovina和Isobel Mclean等组成的跨学科团队,他们正在开发一种名为MycoToile...

Sep 27, 2025

高功率微波击败无人机编队

前海军采购总监詹姆斯·‘霍ンド’·古尔斯和准将约瑟夫·雷尼斯加入爱皮鲁斯战略咨询委员会。

Sep 27, 2025

GPT-OSS 强化学习

Unsloth是一个新的框架,用于通过强化学习(RL)和GRPO训练OpenAI的gpt-oss模型。它提供了以下优势: 最快的推理速度(比现有实现快3倍),最低的VRAM使用量(比其他实现低50%),最长上下文长度(比其他实现长8倍),且没有精度损失。 通过重写推理代码,实现了3倍于Transformer代码的推理速度,并支持BF16,使得推理速度达到...

Sep 27, 2025

每秒将数十亿字符串转换为整数而不发生冲突

本文探讨了如何在分布式系统中以高吞吐量和低冲突的方式将大量字符串转换为整数。作者首先介绍了在构建一个基于FoundationDB的Redis RESP3兼容键值数据库时遇到的挑战,即如何高效地处理大量键。由于需要处理超过15亿条记录,作者需要从使用uint32扩展到uint64。然而,直接使用uint64和Roaring Bitmaps会遇到并发冲突和数据竞...

Sep 26, 2025

小偷很快就会被无人机追捕。

本文介绍了Flock公司无人机项目的应用。前警察局长凯斯·考夫曼表示,无人机项目类似于911紧急呼叫,但更像是报警呼叫。在零售盗窃案例中,如果商店安保人员发现小偷离开,他们可以从屋顶的停靠站启动配备摄像头的无人机。无人机可以追踪小偷及其车辆,并将视频实时传输给公司安保团队或警方。

Sep 26, 2025

Open Social

本文探讨了开源软件的胜利及其对数据开放运动的启示。作者认为,像开源软件一样,开放社交运动(open social)也有潜力改变我们与数据的关系。文章指出,当前社交媒体平台将用户数据封闭在各自的数据库中,导致用户无法控制自己的数据。而开放社交运动则旨在让用户拥有自己的数据,并通过AT协议等技术实现数据的可移植性和互操作性。作者认为,开放社交运动将促进数据的自由...

Sep 26, 2025

具有硬件关闭开关的旗舰智能手机,用于保护隐私

Murena与HIROH公司合作推出了HIROH Phone,这是一款注重隐私的智能手机。该手机具备双安全开关,可切断摄像头和麦克风的电源,以及一键禁用所有无线通信。硬件方面,它搭载MediaTek Dimensity 8300 SoC、16GB RAM和512GB存储。软件上运行/e/OS,提供无Google服务的体验。手机配备6.67英寸AMOLED显示...

Sep 26, 2025

DeepFabric – 以规模生成高质量合成数据集

DeepFabric 是一个用于生成合成数据集的工具,旨在为语言模型的训练、评估和研究提供支持。它基于主题驱动的数据生成概念,提供层次化的主题树和基于图的实验性主题建模,以创建多样化的、上下文丰富的训练示例。DeepFabric 通过三个阶段的管道操作,从简单的提示生成综合数据集。它支持研究人员、工程师和从业者生成高质量的合成数据,用于模型蒸馏、智能体评估或...

Sep 26, 2025