Look for any podcast host, guest or anyone
Showing episodes and shows of

Goodfire

Shows

MTS2026-05-081h 06AI可可AI生活
AI可可AI生活[人人能懂AI前沿] 流形操纵、无损植入与高质量反馈你有没有想过,一个“太聪明”的AI,反而会学会钻空子,导致整个系统一起“变笨”?你是否好奇,AI大脑的内部结构可能不是我们想象的开放广场,而是一张弯弯绕绕的精密地图?本期节目,我们将一起潜入AI的“心智世界”,看看最新论文是如何教会AI拥有“远见”来避免自我毁灭,如何像开赛车一样在它大脑的“流形赛道”上精准驰骋,甚至是如何用“不开刀”的方式给它无损植入新知识。更重要的是,我们会发现,原来给AI提建议和给它参考资料,都可能是在“越帮越忙”。准备好了吗?让我们一起挑战关于AI的四个“想当然”。00:00:45 当AI学会了钻空子,我们如何防止它“聪明反被聪明误”?00:06:20 AI的“脑回路”长啥样?我们可能一直都搞错了00:10:56 AI升级难题,一个“不开刀”的手术方案00:16:04 为什么夸人“你真棒”是最低效的鼓励?00:20:33 给AI帮忙,为何会越帮越忙?本期介绍的几篇论文:[LG] Explaining and Preventing Alignment Collapse in Iterative RLHF [PSL Research University] https://arxiv.org/abs/2605.04266 ---[LG] Manifold Steering Reveals the Shared Geometry of Neural Network Representation and Behavior [GOODFIRE] https://arxiv.org/abs/2605.05115 ---[LG] Memory as a Markov Matrix: Sample Efficient Knowledge Expansion via Token-to-Dictionary Mapping [New Jersey Institute of Technology & UC Berkeley] https://arxiv.org/abs/2605.04308 ---[LG] Efficiently Aligning Language Models with Online Natural Language Feedback [Stanford University & Anthropic] https://arxiv.org/abs/2605.04356 ---[LG] When Context Hurts: The Crossover Effect of Knowledge Transfer on Multi-Agent Design Exploration [Meta] https://arxiv.org/abs/2605.04361
2026-05-0827 minLessWrong (Curated & Popular)2026-05-0704 minLessWrong (30+ Karma)2026-05-0504 minThe Automated Daily - AI News Edition2026-05-0208 minThe Automated Daily - AI News Edition2026-05-0208 minThe Automated Daily - AI News Edition2026-05-0208 minThe Automated Daily2026-05-0208 minThe AI Signal & The AI Noise2026-05-0110 minCreative AI Digest / クリエイターのためのAIニュース2026-04-3005 minSignal Daily: AI & Robotics Briefing2026-04-3003 minSignal Daily News2026-04-3003 minReSay2026-04-2322 minPSBTA Presents: Catching Wildfire (Audio)2026-03-3048 minPSBTA Presents: Catching Wildfire (Video)2026-03-2448 min\2026-03-051h 47Silicon Valley Tech Watch: Startup & Innovation News2026-02-2002 minThe Art of the Zag2026-02-171h 23The AI & Tech Society by Danar2026-02-1025 minOWITH.ai - Only What\'s Important to Hear around AI and Tech2026-02-0904 minStartup Insider2026-02-0709 minLatent Space: The AI Engineer Podcast2026-02-061h 08This Week in Pre-IPO Stocks2026-02-0614 minStartup Insider2026-02-0617 minThe Automated Daily - AI News Edition2026-02-0515 minThe Automated Daily - AI News Edition2026-02-0509 minThe Automated Daily - AI News Edition2026-02-0513 min2025-12-2140 minLatent Space: The AI Engineer Podcast2025-11-141h 25Latent Space: The AI Engineer Podcast2025-11-141h 25Ribbit Ribbit2025-11-0822 minAI可可AI生活
AI可可AI生活[人人能懂] 开卷考试、梦境健身房与那条没走的路今天,我们将一起探索AI那些不为人知的“内心世界”和“隐藏技能”。我们将揭示AI如何“感知”到那些它放弃了的“平行世界”,又如何区分自己是“真的不懂”还是“问题太复杂”。同时,我们还会看看它如何通过“开卷考试”和在“梦境健身房”里训练,突破我们想象的效率极限。这些最新论文,正在颠覆我们对AI效率、智能甚至“坦诚”的传统认知。00:00:34 AI加速生成:快与好的两难,如何破局?00:07:26 AI的“遗忘”与“再利用”:一份被浪费的宝藏00:12:42 AI的“内心戏”:它知道自己放弃了什么吗?00:18:00 AI的专属健身房:让它在梦里学会真本事00:23:35 AI的“我不知道”,你真的读懂了吗?本期介绍的几篇论文:[LG] Optimal Inference Schedules for Masked Diffusion Models  [Harvard & UW]  https://arxiv.org/abs/2511.04647 ---[CL] Reusing Pre-Training Data at Test Time is a Compute Multiplier  [Apple & Stanford]  https://arxiv.org/abs/2511.04234 ---[CL] Are language models aware of the road not taken? Token-level uncertainty and hidden state dynamics  [Stanford University & Goodfire & NTT Research]  https://arxiv.org/abs/2511.04527 ---[LG] Scaling Agent Learning via Experience Synthesis  [Meta Superintelligence Labs]  https://arxiv.org/abs/2511.03773 ---[LG] The Illusion of Certainty: Uncertainty quantification for LLMs fails under ambiguity  [Technical University of Munich]  https://arxiv.org/abs/2511.04418 
2025-11-0829 minRibbit Ribbit2025-11-0753 min\2025-11-052h 24Ribbit Ribbit2025-11-0553 minAI可可AI生活
AI可可AI生活[人人能懂] AI的动态思维、可塑信念与捷径法则你真的了解那个天天与你对话的AI吗?这一期,我们来当一回“AI读心师”,带你换个全新的视角看AI。我们会潜入AI思考的“时间之河”,揭示它那颗会悄悄“变心”的内在。更重要的是,我们将看到几篇最新论文,是如何教会AI聪明地“抄近道”、真正地“辨因果”,并最终找到那个任你怎么问都不会动摇的“坚固答案”的。00:00:30 AI的“时间盲区”:我们看懂它的方式,可能一开始就错了00:05:35 那个天天陪你聊天的AI,正在悄悄“变心”00:11:23 高手过招:如何聪明地“抄近道”?00:16:33 想用AI解决数据难题?你得先学会给它“立规矩”00:23:46 换个姿势再问一遍:如何找到最可靠的答案?本期介绍的几篇论文:[LG] Priors in Time: Missing Inductive Biases for Language Model Interpretability[Goodfire AI & Harvard University]https://arxiv.org/abs/2511.01836---[CL] Accumulating Context Changes the Beliefs of Language Models[CMU & Princeton University]https://arxiv.org/abs/2511.01805---[RO] SLAP: Shortcut Learning for Abstract Planning[Princeton University & CMU]https://arxiv.org/abs/2511.01107---[LG] A Technical Exploration of Causal Inference with Hybrid LLM Synthetic Data[UC Berkeley]https://arxiv.org/abs/2511.00318---[CL] Self-Harmony: Learning to Harmonize Self-Supervision and Self-Play in Test-Time Reinforcement Learning[The University of Tokyo & RIKEN Center for Advanced Intelligence Project]https://arxiv.org/abs/2511.01191
2025-11-0529 minGenerative Now | AI Builders on Creating the Future2025-10-021h 02AI Visibility by Jason Todd Wade, Founder of BackTier2025-09-2107 min\2025-08-282h 02Training Data2025-07-0847 minAIわくわくミニキャスト!
AIわくわくミニキャスト!LLM社会実装フェーズへ。データ覇権争いとセキュリティリスクが顕在化なのだ! 2025年6月19日配信日: 2025年6月19日記事一覧:Claude 4.0とGoodfire Ember|Anthropicが推進する解釈可能なAI戦略が企業のLLM導入を加速【要約】AnthropicはAIの「ブラックボックス問題」を解消し、企業LLM導入を加速する「解釈可能なAI」戦略を推進。Claude 4.0やGoodfire投資で透明なAI活用を促し、説明責任が求められる分野での企業競争力強化を目指す。三菱電機が2つの技術でエッジ動作可能なLLMを高精度化、2026年度にも製品適用へ - MONOist【要約】三菱電機は、エッジデバイス向けLLMを開発。知識獲得とタスク特化の学習で精度を大幅向上させ、オンプレミスでのLLM実行を実現。通信遅延・セキュリティ・コスト課題を解決し、2026年度の実用化を目指す。AIのモデルとインフラの選択肢を広げるvLLM--レッドハットのAI CTOに聞く可能性 - ZDNET Japan【要約】Red Hatは、オープンソースの推論ライブラリー「vLLM」がAIインフラの複雑化やコスト課題を解決すると発表。効率的なメモリー管理「PagedAttention」でLLMサービングの性能とコスト効率を改善し、多様なLLMやインフラをサポート。Googleアプリでの「AI Mode」、音声会話式検索の提供開始(米国で)【要約】Googleアプリで新機能「Search Live」(AI Modeの一部)が提供開始。AIとの音声会話による対話型検索が可能になり、質問への回答と関連リンクを生成。バックグラウンド継続やテキスト表示もでき、AI検索体験を強化。Archaic、日本語特化型RAGシステムAIを開発。製造業分野でトップクラスの正答率【要約】Archaicは、日本語業務文書に特化したRAGシステムAIを開発。図表含む複雑な文書構造を保持し、高精度な回答を生成。独自の文書解析エンジンで構造を理解し、製造業分野でトップクラスの正答率を記録。「構造理解型RAG」で実用性を実証。生成AIによる攻撃の「質」と「量」が増加Zscalerがフィッシングレポートを公開【要約】Zscalerレポートによると、AI活用によりフィッシング攻撃が巧妙化・増加。AIが生成する偽サイトやコンテンツで機密情報窃取が高度化している。従来の防御は不十分で、AIを防御にも活用した包括的なセキュリティ対策の重要性を強調。脳科学者・茂木健一郎、『LLMの知性定量化』で「テレンス・タオの賢さをどう測るのか」問題提起【要約】脳科学者・茂木健一郎氏は、LLMの知性定量化に疑問を呈し、AIが人間の脳の「ゆらぎ」や「身体性」といった複雑な特性には及ばない可能性を指摘。AI進化には限界があるとし、人間の脳の独自性の重要性を強調した。LLMにプロンプトのみで仮想的な強化学習を発生させる方法【要約】LLMがプロンプトのみで仮想的な強化学習を行い、自己改善する研究。人間が調整せずともフィードバックで賢くなる手法を模索し、「学びの力」を引き出すプロンプトの工夫を検証。LLMの使い勝手向上を目指す。Geminiを業務で使いこなす!Google Cloudが指南する「プロンプト入力」4つのポイントは?【要約】Google Cloudがビジネス向けGemini活用法を解説。プロンプト作成には役割・詳細・タスク・フォーマットの4要素が重要。「Gem」「Deep Research」「NotebookLM」機能を紹介し、AIは触って試すことがビジネス活用の第一歩と強調した。レガシーシステムの「塩漬け戦略」もアリ?AIエージェント時代のITシステム構成を考える【要約】AIエージェントが本格活用され、システム改修不要な可能性も。ツールを呼び出しタスク遂行する技術で、複数エージェント連携も。適切な指示が課題だが、レガシーシステムとの連携でデータ活用も進む。ITシステム開発を変革する可能性。OpenAI、スケールAIとの協業打ち切りへ-メタ巨額出資で判断 - NewsPicks【要約】OpenAIは、メタが実質支配したスケールAIとの協業を打ち切りへ。競合への機密情報漏洩リスクを懸念。Googleも同様の動きを見せており、AI開発競争において高品質データの確保と内製化戦略の重要性が高まっている。【7/16開催ウェビナー】LLM開発におけるGPUクラウドとオンプレの徹底比較! ~独自LLMの開発秘話からGPUコストを削減するための具体的なポイントまで一挙大公開~【要約】アイスマイリーが7月16日に無料ウェビナー開催。LLM開発のGPUクラウドとオンプレミスを徹底比較し、コスト削減ポイントや独自LLM開発秘話を公開。GPU環境選択に悩むDX・AI開発部門向けに、最大70%コスト削減手法などを解説する。
2025-06-1909 minAI for Procurement Podcast | AI4Procurement | Dé NL-talige podcast voor kenniswerkers in Procurement, Inkoop, Category Management, Leveranciers- en Contractmanagement | Powered by Qando2025-06-1454 min\2025-05-301h 49起業の履歴書2025-05-2112 min起業の履歴書
起業の履歴書AIは制御できるのか?【The Urgency of Interpretability】今回はAnthropic CEOのDario Amodeiが書いた『The Urgency of Interpretability』について話しました。【目次】(00:00) 今回のテーマ「AIをどうやって制御するのか」(00:21) 今回の参考文献『The Urgency of Interpretability』(00:41) AIはブラックボックスである(02:18) 「AIの内部構造の解明」で解決する3つの問題(04:15) モデル解明(Model Interpretability)研究の今(09:39) Superalignmentの手法: AIモデルの脳スキャン(14:00) 我々人類のやるべきこと - 1.AI安全性研究にもっと取り組む(16:06) 我々人類のやるべきこと - 2.AI安全性についてのルールを作る(16:42) 我々人類のやるべきこと - 3.AI開発においてアメリカのリードを広げる(18:43) 我々人類のやるべきこと - まとめ(19:02) まとめ(19:51) AnthropicのAlignment研究【参考文献】- https://www.darioamodei.com/post/the-urgency-of-interpretability- https://openai.com/index/language-models-can-explain-neurons-in-language-models/- https://transformer-circuits.pub/2025/attribution-graphs/biology.html- https://www.anthropic.com/research/exploring-model-welfare- https://youtu.be/pyXouxa0WnY?si=19FEKkB4Nt-MNS1U- https://techstartups.com/2025/04/18/anthropic-backs-goodfire-in-50m-series-a-to-decode-ai-models-marking-first-ever-startup-investment/【起業の履歴書について】起業の履歴書は「偉大な企業を作り上げた起業家やその企業の歴史や哲学 📚」を掘り下げたり「スタートアップのテクノロジートレンド 💻」について話すチャンネルです!<ホスト>・East Ventures 村上雄也 - https://twitter.com/yu8muraka3・伊藤工太郎 - https://twitter.com/etaroid<Podcast>Spotify - htt
2025-05-0720 minGREY Journal Daily News Podcast2025-05-0102 minПодкаст на Вайбе
Подкаст на ВайбеУчёные ищут сознание у ИИ / GPT 4.1, o3, o4-mini / Полный обзор ”Чёрного Зеркала” / AIA Podcast #109👉 Видео про агенов на нашем англоязычном канале: https://youtube.com/watch?v=FF90PmbZ0T0 👉 Курс AI-supported engineering: https://aw.club/global/en/courses/ai-supported-software-engineering 👉 Наш чатик в ТГ: https://t.me/aiapodcast Сегодня ныряем в мир ИИ: обсуждаем горячие покупки OpenAI (Windsurf, собственная соцсеть, Codex в опенсорсе), новые модели GPT-4.1 и o3, амбициозные планы Anthropic по интерпретируемости и сознанию ИИ, свежие релизы от Google (Gemini 2.5 Flash) и Nvidia (производство ИИ-чипов в США), тестируем обновления в Grok и новых ассистентов от JetBrains и Docker, кайфуем от музыкальных возможностей DeepMind (Lyria 2) и видеоаватаров Character.AI, следим за революцией в кино с Runway и Fabula, изучаем первого в мире опенсорс-агента общего назначения Suna и погружаемся в законотворческие ИИ-эксперименты в ОАЭ. Ну а в финале — мощнейший полный разбор со СПОЙЛЕРАМИ всех серий нового сезона «Чёрного зеркала», ведь каждая из них так или иначе про ИИ!   НАВИГАЦИЯ 0:00 Разгон про СДВГ и вайб-коддинг 14:01 Большие рыбы: слухи OpenAI, GPT 4.1, o3, o4-mini, исследования Anthropic и Canvas в Grok 1:01:14 Что ещё: Junie, Docker AI, Trae IDE, новинки ИИ в аудио и видео 1:29:22 Закон и порядок: ИИ в ОАЭ 1:35:08 Наука и техника: марафон для роботов 1:38:47 Сервисы и ссылки: мануал по работе с агентными ассистентами 1:39:35 Этика: Оскар за ИИ 1:51:18 Обзор нового сезона Чёрного Зеркала (СО СПОЙЛЕРАМИ!!!) 2:52:16 Конец обзора и оценка сезону без спойлеров + рекомендации по старым сериям от Вити   🔹 Instant ADHD Support от Вити: https://www.adhdhelp.app 🔹 ИИ-сообщество для программистов от Лёши: https://t.me/evocoders 🔹 Зенкодер купили Машинет: https://zencoder.ai/blog/zencoder-acquires-machinet 🔹 Слухи про покупку Windsurf: https://www.axios.com/2025/04/17/openai-windsurf-3-billion-microsoft 🔹 Почему OpenAI выбрали Windsurf вместо Cursor: https://techcrunch.com/2025/04/22/why-openai-wanted-to-buy-cursor-but-opted-for-the-fast-growing-windsurf/ 🔹 OpenAI хотят купить Chrome: https://www.reuters.com/sustainability/boards-policy-regulation/google-contemplated-exclusive-gemini-ai-deals-with-android-makers-2025-04-22/ 🔹 OpenAI разрабатывает соцсеть: https://www.theverge.com/openai/648130/openai-social-network-x-competitor 🔹 Новые модели GPT-4.1, GPT-4.1 mini и GPT-4.1 nano: https://www.techtarget.com/whatis/feature/GPT-41-explained-Everything-you-need-to-know 🔹...
2025-04-262h 57名古屋ではたらく社長のITニュースポッドキャスト2025-04-2402 minThursdAI - The top AI news from the past week2024-12-271h 35The Bearhug Experience2024-10-2413 minSoftware Defined Talk2024-08-231h 09\2024-08-171h 51True Crime Garage2023-08-3048 minTrue Crime Garage2023-08-3051 minHigh Fidelity2023-04-2716 minWhat is California?2022-09-1349 minBalderdash Academy2022-06-1423 minBalderdash Academy2022-06-091h 13Balderdash Academy2022-06-0713 minBalderdash Academy2022-06-0355 minBalderdash Academy2022-06-0152 minThe Howlers Podcast2021-12-151h 25AnthroDish2021-12-0754 minOut Of Office: A Travel Podcast2021-08-3152 minGraining In2021-07-261h 48Imagining Community2021-05-1902 minMaine Beer Geeks Podcast2021-03-0248 minSTRIVECast2020-12-2348 minBach to Bock2019-12-1729 minThe 16oz. Canvas - The Art of Craft Beer2019-07-191h 18The 16oz. Canvas - The Art of Craft Beer2019-07-191h 18ABV Chicago Craft Beer Podcast2018-10-031h 02The Fire Learning Trail2018-07-0214 minThe Fire Learning Trail2018-06-1414 minThe Fire Learning Trail2018-06-1414 minSips, Suds, & Smokes2018-06-0850 minSips, Suds, & Smokes2018-06-0850 minThe Fire Learning Trail2018-04-0200 minThe Fire Learning Trail2018-04-0214 minThe Fire Learning Trail2018-04-0200 min