All Stories

启动 HN:Cyberdesk (YC S25) – 自动化 Windows 传统桌面应用程序

Cyberdesk 是一款用于自动化 Windows 桌面应用程序的确定性计算机使用代理。它可以帮助开发者自动化医疗保健、会计、建筑等多个行业中的重复性任务。Cyberdesk 通过执行点击和按键直接进入桌面应用来实现自动化,避免了传统 RPA 脚本的脆弱性和不灵活性。Cyberdesk 的代理在执行任务时能够根据屏幕状态进行自我修正,并且能够从自然语言指令...

Aug 14, 2025

JetBrains 正在开发一种更高抽象层次的编程语言

JetBrains公司,Kotlin编程语言的创造者,正在开发一种新的编程语言,旨在使人工智能和代码更加可控和透明。JetBrains首席执行官Kirill Skrygan在7月23日的采访中详细介绍了该公司关于这种尚未命名的语言的计划,该语言将使用更高的抽象级别来描述程序。Skrygan回顾了计算机代码最初是用汇编语言编写的,然后发展到C和C++等更高层次...

Aug 14, 2025

Gemma 3 270M:超高效人工智能的紧凑型模型

Gemma 3 270M 是一款专为特定任务微调而设计的紧凑型模型,具有270百万参数。它继承了Gemma 3系列的先进架构和强大的预训练能力,适用于高容量、定义明确的任务,如情感分析、实体提取、查询路由等。该模型具有低功耗、强大的指令遵循能力和文本结构化能力,适用于边缘设备和应用。Gemma 3 270M 可以帮助开发者快速构建和部署专用的AI模型,实现高...

Aug 14, 2025

hustle culture 的根本缺陷

本文讨论了人工智能公司中普遍存在的“加班文化”。文章指出,许多AI公司为了在竞争中脱颖而出,强迫工程师长时间工作,甚至将长时间工作视为荣誉。作者认为这种文化是不可持续的,并引用了历史数据和现代研究来支持这一观点。文章指出,长时间工作会导致生产力下降、员工倦怠和高昂的替换成本。作者呼吁AI公司采取更健康的工作条件,以提高整体效率和员工福祉。

Aug 14, 2025

Perplexity 意欲以 345 亿美元收购 Google Chrome。

Perplexity公司向谷歌提出以345亿美元收购Chrome浏览器的非正式报价,这一价格远高于Perplexity自身的估值。该报价是在Perplexity表示如果政府强制谷歌出售Chrome浏览器,它将购买Chrome之后不久提出的。此外,Perplexity今年早些时候也曾提出收购TikTok。尽管谷歌尚未表明会以任何价格出售Chrome,且法院尚未...

Aug 13, 2025

启动 HN:Golpo(YC S25)- AI 生成解释性视频

该内容介绍了一种AI视频创作工具,可以将文档转换为白板动画视频,提供专业的解释性视频制作服务。用户无需具备技术技能即可使用该工具。

Aug 13, 2025

股票期权是如何工作的

员工股票期权计划通常由公司董事会授权,允许公司向员工授予相当于公司流通股份一定比例的期权。这些期权赋予员工在一定期限内以固定价格购买公司股票的权利。期权通常在授予后一年开始行权,四年内完全行权。如果员工在公司行权前离职,期权将被取消。一旦期权行权,员工可以以行权价格购买股票,然后持有或出售。行权价格与行权时股票市场价格的差额是员工的收益。如果行权价格高于市场...

Aug 13, 2025

为什么我们从 Neon 迁移到 PlanetScale

OpenSecret公司因Neon数据库服务的不稳定性和高昂成本,决定迁移至PlanetScale。Neon在收购期间频繁出现数据库故障,导致服务中断,而PlanetScale提供了更可靠、可观测且成本效益更高的数据库服务。迁移后,OpenSecret实现了零宕机时间,性能显著提升,并获得了更好的成本控制。

Aug 12, 2025

Apache Iceberg中的等值删除问题

本文探讨了Apache Iceberg中平等删除问题的挑战和解决方案。文章首先介绍了Postgres和Apache Iceberg在数据基础设施领域的应用,并指出将Postgres与Iceberg结合使用时,实时数据流传输的难点。接着,文章详细解释了Iceberg中两种删除机制:位置删除和平等删除,并分析了它们在批处理和流式CDC场景下的适用性。文章指出,尽...

Aug 12, 2025

Nexus:一个用于治理、控制和可观察性的开源AI路由器

Nexus是一款强大的AI路由器,旨在优化AI代理与多个MCP工具和大型语言模型(LLM)的交互方式。它作为中央枢纽,聚合MCP服务器并提供智能LLM路由、安全性和治理功能。Nexus解决了AI生态系统中两个关键挑战:MCP服务器聚合和智能LLM路由。它通过单一接口管理多个MCP服务器的连接,并根据任务、成本和性能要求智能路由请求。Nexus旨在简化AI应用...

Aug 12, 2025

让我们来谈谈一人的十亿美元公司。

文章讨论了一个人创立价值十亿美元的公司的可能性。作者认为,尽管有AI等技术的支持,但创始人对痛苦的忍受能力是最大的障碍。文章提到Sam Altman和Dario Amodei等业界人士认为这种模式是不可避免的。作者指出,目前最接近这一目标的人可能是Heather Cox Richardson,她的时事通讯年收入可达1200万美元。文章还提到,要达到十亿美元的...

Aug 12, 2025

启动 HN:设计领域(YC S25)- 美学对抗性 AI 基准测试

Design Arena 是一个由 Grace 创建的平台,旨在通过众包的方式对 AI 生成的视觉作品(如网站、图像、视频等)进行基准测试。该平台将不同的 AI 模型和构建工具进行对比,并由来自世界各地的真实用户进行投票。Design Arena 的灵感源于一个 AI 游戏引擎项目,但团队发现 AI 在视觉表现方面存在不足。因此,他们开发了这样一个平台,让用...

Aug 12, 2025

Claude 对比 Gemini:在 100 万个上下文标记上的测试

Anthropic发布了Claude Sonnet 4的新版本,其上下文窗口扩展到100万个标记,相当于《哈利·波特》全书的文本量。通过三个主要测试,包括长文本分析、长代码分析和AI外交,结果显示Claude Sonnet 4在速度和准确性方面优于Google的Gemini模型,但在细节分析方面稍逊一筹。在代码分析任务中,尽管Claude Sonnet 4的...

Aug 12, 2025

Claude Sonnet 4 现在支持 1M 个上下文令牌

Anthropic API 和 Amazon Bedrock 现已支持 Claude Sonnet 4 的长上下文功能,最多可处理 100 万个 token,相比之前提升了 5 倍。这允许用户在单个请求中处理超过 75,000 行代码的整个代码库或数十篇研究论文。长上下文支持目前处于公共测试阶段,并将在 Google Cloud 的 Vertex AI 上推...

Aug 12, 2025

AI代理70%的时间无法完成任务。

本文介绍了TheAgentCompany,一个用于评估AI代理在执行现实世界任务中表现的基准。该基准模拟了一个小型软件公司的环境,并创建了各种可能由公司员工执行的任务。测试了基于闭源API和开源权重语言模型的基线代理,发现最具有竞争力的代理可以自主完成30%的任务。这表明,在模拟真实工作场所的环境中,许多简单任务可以自主解决,但更复杂的长远任务仍超出现有系统...

Aug 12, 2025