Look for any podcast host, guest or anyone
Showing episodes and shows of

Claude Warren, Jr.

Shows

Successful Idiots | Using AI to Grow Your Business2026-06-0751 minFor Your Own Good2026-06-0427 minKI und Tech to Go - der Praxis-Pitch2026-06-041h 42AI Signal Daily2026-06-0311 minHennigan\'s Huddle2026-06-0214 minHennigan\'s Huddle2026-06-0214 minThe AI Argument2026-05-2939 minEasyVibeCoding Podcast
EasyVibeCoding Podcast@karpathy:Andrej Karpathy 正式加入 Anthropic 預訓練團隊,將領導以「Claude」加速研發的新方向。 核心動態 前「Tesla」AI 總…Andrej Karpathy 正式加入 Anthropic 預訓練團隊,將領導以「Claude」加速研發的新方向。 核心動態 前「Tesla」AI 總監、OpenAI 創始團隊成員 Andrej Karpathy 於 2026 年 5 月 19 日在個人 X 帳號宣布,已正式加入 Anthropic,並於本週開始在預訓練(pre-training)團隊負責人 Nick Joseph 麾下工作。他在貼文中表示:「未來幾年在 LLM 的前沿將特別具有形塑意義,我非常興奮能加入這個團隊並重返研發工作。」同時,他強調自己對教育的熱情未減,計畫在適當時機重啟相關工作。 職務重點 此次加入並非單純的人才招募。Anthropic 發言人向 TechCrunch 證實,Karpathy 將啟動一個新團隊,專注於「使用 Claude 本身來加速預訓練研究」。預訓練是構建前沿模型最昂貴、最耗算力的階段,負責「Claude」核心知識與能力的大規模訓練。這項任命被視為 Anthropic 對「AI 輔助研究」而非「純算力堆疊」的明確押注。 社群反應 此消息發布後,隨即在 AI 社群引發熱烈迴響: 「Claude Code」創造者 Boris Cherny(@bcherny)回覆:「Welcome!! So excited we get to work together 👋」 Anthropic 政策負責人 Jack Clark(@jackclarkSF)寫道:「Will be awesome to work together again!」 Anthropic 幕僚長(Chief of Staff)Avital Balwit(@avitalbalwit)表示:「Welcome to the team! We’re so excited」 「Claude Code」團隊成員 Thariq Shihipar(@trq212)也於同日下午 4:29 回覆:「@karpathy welcome!!」 媒體層面,Axios 資深記者 Ina Fried、科技媒體人 Christina Warren 等也在 X 轉發評論,Warren 形容這是「huge hire by Anthropic」。Reuters、TechCrunch、Axios、Business Insider 均跟進報導。 未來展望 Karpathy 在 OpenAI 從事深度學習與電腦視覺研究,2017 年離開後加入「Tesla」主導「Full Self-Driving」(FSD)與「Autopilot」計畫,2022 年離職並於 2023 年短暫回到 OpenAI,2024 年再次離開以創辦教育新創「Eureka Labs」。他是少數能在 LLM 理論與大規模訓練實務之間架起橋樑的研究者,此次任命被視為 Anthropic 在前沿模型競賽中對抗 OpenAI 與 Google 的關鍵布局。同時,Anthropic 也宣布前 Meta 資深資安專家 Chris Rohlf 加入其「Frontier Red Team」,負責對先進模型進行嚴峻威脅的壓力測試。原文:https://easyvibecoding.app/curated/1443
2026-05-1902 minShow Your Priors Podcast2026-05-051h 34Overtired2026-04-241h 07Bitcoin And | Bitcoin & Economic News2026-04-151h 22Adventures in DevOps2026-04-0940 minExecutive Function Brain Trainer Podcast2026-04-0753 min株式会社ずんだもん技術室AI放送局
株式会社ずんだもん技術室AI放送局株式会社ずんだもん技術室AI放送局 podcast 20260402youtube版(スライド付き) 関連リンク Holo3: Breaking the Computer Use Frontier 本記事は、自律型エンタープライズの実現を目指すH社が発表した、コンピュータ操作(Computer Use)に特化した最新AIエージェント「Holo3」の紹介記事です。Holo3は、デスクトップPCの操作能力を測る主要ベンチマーク「OSWorld-Verified」において、78.85%という業界最高水準のスコアを達成し、既存の巨大なプロプライエタリ・モデルを凌駕する性能を示しました。 【技術的な核心:Agentic Learning Flywheel】 Holo3の強みは、モデルの「知覚」と「意思決定」を継続的に磨き上げる「Agentic Learning Flywheel(エージェント学習の弾み車)」という特殊なトレーニングパイプラインにあります。 合成ナビゲーションデータ:人間とAIの指示に基づき、多様な操作例を生成。 ドメイン外拡張:未知のUIや予期せぬ挙動にも対応できるよう、プログラムを用いてシナリオを増幅。 厳選された強化学習(Curated RL):高度なフィルタリングを経たデータを用いた強化学習により、タスク実行の精度を最大化しています。 【実用性を支える「合成環境工場」と評価指標】 開発チームは、現実の企業システムを模した環境を自動生成する「Synthetic Environment Factory」を構築しました。コーディングエージェントがウェブサイトをゼロから構築し、そこで複雑なタスクをエージェントに実行させることで、実務に近い訓練を行っています。 さらに、独自の評価指標「H Corporate Benchmarks」を導入。これは、PDFから備品の価格を取得し、予算と照らし合わせ、個別に対象者へメールを送るといった、複数のアプリケーションを跨ぐ高度な推論と持続的な作業が必要な486のタスクで構成されています。 【効率的なモデル構成とオープン化】 Holo3-122B-A10Bは、122B(1220億)の総パラメータを持ちつつ、実行時に動くのは10B(100億)という効率的なアーキテクチャを採用しています。これにより、GPT 5.4やOpus 4.6といった超巨大モデルに比べて遥かに低コストで運用可能です。また、より軽量な「Holo3-35B-A3B」はApache 2.0ライセンスでオープン公開されており、誰でも利用・開発が可能です。 【新人エンジニアへのメッセージ】 「AIがPCを操作する」技術は、単なる自動化から、未知のソフトウェアをリアルタイムで学習・操作する「Adaptive Agency(適応型エージェント)」の段階へ進化しようとしています。Holo3のように軽量で高性能なオープンモデルが登場したことで、特定の業務に特化したエージェントを自分たちで構築・改善できるエキサイティングな時代が到来しています。最先端のベンチマーク手法や、合成データを用いた学習サイクルを理解することは、これからのエンジニアにとって大きな武器になるはずです。 引用元: https://huggingface.co/blog/Hcompany/holo3 Ubieにおける一年間のセキュリティ分析AIエージェントの運用 Ubie社が約1年間にわたり運用してきた、セキュリティ分析AIエージェント「Warren」の実践的な知見をまとめたドキュメントです。新人エンジニアの方にとっても、生成AIを実際の業務フローに組み込む際の「一歩進んだ活用術」として非常に参考になる内容です。 ■ セキュリティ分析とAIエージェント「Warren」 セキュリティ分析とは、EDRや脆弱性スキャナーなどのツールが検知した膨大な「アラート」を調査し、それが「本当に危険な攻撃(真の陽性)」か、あるいは「正当な業務による誤検知(偽陽性)」かを判断する業務です。従来は熟練のエンジニアが数十分かけてログを検索し、文脈を読み解く必要がありました。 これに対し、Ubieが開発した「Warren」は、Claudeなどの高性能なLLMを搭載したAIエージェントです。単なる要約ツールではなく、自らツールを使いこなして調査を完結させる能力を持っています。 ■ AIエージェント運用のメリット 圧倒的な情報収集スピード: AIはBigQueryへのクエリ実行、EDRのAPI連携、Slackの履歴検索、GitHub上のコード確認などを数分で並列実行します。人間が「どこに情報があったか」を思い出す手間をすべて代行し、認知負荷を大幅に下げてくれます。 人間を超える誤検知の判定: 社内環境やログの詳細を突き合わせることで、多くの誤検知を正確に排除できます。推論能力の向上により、現状では人間はAIの出した結論を確認するだけで済むレベルに達しています。 ■ 実践で得られた「AIを使いこなすコツ」 忖度させないプロンプト設定: AIはリスクを大げさに言ったり、ユーザーに合わせたりする傾向(忖度)があります。そのため、「真実を追求せよ」「複数の解釈を検討せよ」「反証を探せ」といった厳格な思考スタンスをシステムプロンプトで徹底させることが不可欠です。 「データ」ではなく「コンテキスト」を教える: 単にログを見せるだけでなく、ネットワーク構成や社内ルールといった「背景情報(コンテキスト)」を与えることで、判断の質が劇的に向上します。 データの引き出し方をガイドする: AIが自発的に動けるよう、データベースのスキーマ解説や、クエリのサンプル(Runbook)を事前に学習・登録しておくことが重要です。 ■ 運用コストと今後の展望 最新モデル(Claude Opusなど)を使用すると、分析1件につき数百円〜千円以上のコストがかかる場合もあります。しかし、「24時間いつでも呼べるTier 1アナリスト」を雇うコストと考えれば、非常にタイパが良い投資といえます。今後は、重大インシデントへの対応や、過去の分析結果を再利用する「記憶管理」の仕組み作りが次の挑戦となります。 生成AIを「チャットツール」としてだけでなく、業務プロセスの中心を担う「自走するエージェント」としてどう育てるか。そのための具体的なヒントが詰まった知見です。 引用元: https://zenn.dev/ubie_dev/articles/ai-sec-alert-ops OpenClaw Arena UniClaw 本ドキュメントは、AIモデルが「エージェント」として実際のタスクをどれだけ遂行できるかを評価するランキング「OpenClaw Arena」の最新結果をまとめたものです。従来のLLM(大規模言語モデル)の評価は、知識を問うベンチマークテストが主流でしたが、本アリーナでは「実際のタスク」「実際の環境」での実行結果を重視しており、実務におけるAIの有用性を測る指標として非常に注目されています。 新人エンジニアの皆さんがこのランキングを読み解く上で、注目すべきポイントを3つに整理しました。 「Flash」や「Fast」モデルの躍進 ランキングのトップ層には「Step 3.5 Flash」や「Grok 4.1 Fas
2026-04-0100 minThis Week In Coworking2026-03-2728 minAdventures in DevOps2026-03-0658 minAktien Buddies by MVI2026-02-271h 05The Dropship Podcast2026-02-1031 minLimitless2026-01-3153 minDirtybird Radio2026-01-201h 02Hacker News Highlights2026-01-0110 minAdventures in DevOps2025-11-2032 minAI with Kyle2025-11-1916 minSmashing Security2025-11-1338 minPrimary Technology2025-10-301h 18Primary Technology2025-10-301h 18The Dropship Podcast2025-10-2841 minAustralian Golf Passport2025-09-271h 31Built 2 Scale2025-08-291h 24Stewart Squared2025-08-2156 minCommerce Today2025-08-1218 minCommerce Today2025-08-1218 minDeep Values2025-07-2325 minPopmundial.com - Music Around the World (5 years of podcasting!)2025-07-101h 24Commerce Today2025-07-0722 minCommerce Today2025-07-0722 minEmerging Technologies for the Future Progress2025-06-1412 minTrue North Stories2025-06-0633 minTingenuity AI2025-05-3045 minKI Kanapee2025-05-2938 minEmerging Technologies for the Future Progress2025-05-0914 minWall Street Whispers2025-05-0308 min250 and Counting2025-03-3103 min250 and Counting2025-03-3103 minEmerging Technologies for the Future Progress2025-01-3115 minRadicalxChange(s)2025-01-3057 minLet storytelling follow you wherever life goes2025-01-0800 min“The Women Who Saved History”2024-09-291h 07The Disruptive Technologies Podcast2024-07-1716 minWords and Movies2024-06-2651 minDe Nederlandse Kubernetes Podcast2024-06-2533 minThe Tim Ferriss Show2024-05-212h 01Les Petites Frousses2024-05-061h 23Executive Function Brain Trainer Podcast2024-04-2944 minExecutive Function Brain Trainer Podcast2024-04-291h 00Dirtybird Radio2024-03-251h 00House of Mystery Radio on NBC2024-03-2233 minAll Things Must Pass : Historical Fiction Podcast2024-03-2233 minThe Christian Past That Wasn\'t: Formerly Telling Jefferson Lies2024-01-1751 minTrinity Forum Conversations2023-12-1234 minThe Scandal of Reading2023-12-0647 minThe Christ and Pop Culture Podcast Network2023-12-0648 minDay Trading Academy Español2023-12-0320 minCEO Blindspots® Podcast2023-11-1003 minMarketing Against The Grain2023-11-0233 minLe pitch était presque parfait2023-09-2016 minFLOSS Weekly (Audio)2023-08-2359 minFLOSS Weekly (Video)2023-08-2359 minStories Mean Business - Nick Warren2023-06-2804 minVoices of True Crime2023-02-1053 minHouse of Mystery Radio on NBC2023-02-1053 minHappy Hour Harmonica Podcast2022-12-0900 minLiberty\'s Highlights2022-11-291h 06The Golfing Greenkeeper Podcast2022-10-272h 04El Opio2022-08-102h 02El Opio2022-08-0800 minRags To Riches Secrets2022-05-2611 minThe Philadelphia Sports Table | Philly Sports News & Views2022-03-2453 minLive and Learn2022-02-171h 03The Philadelphia Sports Table | Philly Sports News & Views2022-02-171h 09Words and Movies2022-01-061h 27Live and Learn2021-02-251h 00Survive To Thrive with Kate McKay2020-12-0230 minClaude Mayers Interviews Influencers, Scientists, Activists, Poets2020-09-2001 minHow Good It Is2020-03-3117 minFounders2019-12-221h 01Founders2019-12-221h 01