Look for any podcast host, guest or anyone
Showing episodes and shows of

DTA Podcast

Shows

TOTVS Developers Podcast2026-01-131h 04The Disciplined Traders Podcast - Master the Market. Build Wealth. Stay Disciplined2025-12-1514 minThe Disciplined Traders Podcast - Master the Market. Build Wealth. Stay Disciplined2025-11-2311 minThe Disciplined Traders Podcast - Master the Market. Build Wealth. Stay Disciplined2025-09-2106 min1 % Better - Hidden Stories in Sport2025-09-121h 031 % Better - Hidden Stories in Sport2025-08-081h 04That Metal Interview Podcast2025-06-2539 minVoices of the Village Podcast2025-06-231h 02株式会社ずんだもん技術室AI放送局
株式会社ずんだもん技術室AI放送局株式会社ずんだもん技術室AI放送局 podcast 20250604関連リンク AIに「分からない」と言わせるための「RAG」の手法 RAG(Retrieval Augmented Generation)は、AIが学習済みデータから得た知識(内部知識)に加え、外部の情報源から検索した情報(外部知識)も参照して回答を生成する技術です。これにより、AIはより正確な情報に基づいた回答を出せるようになります。 しかし、従来のRAGや、さらに工夫を凝らした手法(Astute RAG、RAFTなど)を使っても、AIは回答に必要な情報が内部にも外部にもない場合でも、もっともらしいが実際は誤った情報を作り出してしまう「ハルシネーション(もっともらしいが、実際は誤った情報を生成してしまうこと)」を起こすことがあります。これは、AIが自分の知識の限界を正確に判断するのが難しいためです。 特に、高い信頼性が求められる分野でAIを利用する場合、ハルシネーションは大きな問題となります。そこで注目されているのが、新しい手法「DTA(Divide-Then-Align)」です。この手法の目的は、AIが本当に分からないことには、正直に「分かりません」と答えられるようにすることです。 DTAのポイントは、AIが「分からない」と答えるべき状況を明確に定義し、それを学習させる点にあります。質問に対して、AIが持つ知識で答えられるか、そして外部情報に答えがあるか、という2つの観点からデータを分類します。そして、AIも外部情報も答えを持っていないケース(本当に分からない状況)での「分かりません」という回答を「正しい回答」として学習させることで、AIに知識の境界線を認識させ、「これは答えられない」と判断できるようにします。 このDTA手法を適用した結果、従来のRAGモデルと比較して、回答の正確さを保ちながら、「分からない」と適切に答える能力が大幅に向上することが示されました。特に、知識が全くない状況での正直さが大きく改善されています。 企業向けにAIシステムを提供する場面では、ユーザーがハルシネーションを一度経験すると、AIへの信頼を失ってしまうことがよくあります。そのため、AI自身が知識の限界を理解し、正直に振る舞うことは、AIシステムを広く普及させる上で非常に重要です。今後、様々な種類の情報を取り込むRAGが増えていく中で、DTAのような、AIが「分からない」と言えるようにする技術は、システム開発の重要なポイントとなるでしょう。RAGシステムを開発する際の選択肢として、この考え方が参考になれば幸いです。 引用元: https://zenn.dev/knowledgesense/articles/468d7c853901f8 No GPU left behind: Unlocking Efficiency with Co-located vLLM in TRL 大規模言語モデル(LLM)の学習手法の一つにGRPOというものがあります。これはモデルが自分で文章などを生成し、その結果をもとに学習を進める方法です。この「生成」のステップが学習全体の処理速度(スループット)を遅くする原因(ボトルネック)になることがあります。 Hugging FaceのTRLライブラリでは、この生成ステップを高速化するためにvLLMという技術を利用しています。しかし、これまでは学習を行うGPUとvLLMが動作するGPUを別々に用意する必要がありました(これを「サーバーモード」と呼びます)。この方式では、学習中にvLLMのGPUが待機したり、逆に生成中に学習用のGPUが待機したりと、お互いがアイドルになる時間が多く発生し、GPUリソースの無駄が多く、コストも高くなりがちでした。 この問題を解決するため、TRLに新しく「コローケーションモード」が追加されました。これは、学習とvLLMによる生成を「同じGPU」で実行できるようにする技術です。これにより、学習と生成が同じGPU上で順番に処理されるため、GPUのアイドル時間を大幅に削減できます。また、別々のプログラムとして通信する必要がなくなり、処理のオーバーヘッドも減ります。 実験の結果、コローケーションモードは従来のサーバーモードと比較して、GPUを効率的に使用し、全体の処理速度を向上させることが確認されました。特に、一度に多くのデータを処理する場合や、比較的大きなモデルを扱う場合に効果が高いことが示されています。さらに、非常に大きなモデル(72Bパラメータ)でも、vLLMのGPUメモリ解放機能(sleepモード)や、モデルをGPU間で分散させるDeepSpeed ZeRO Stage 3といった技術と組み合わせることで、コローケーションモードで効率よく学習できることが確認されました。 コローケーションモードは、GPUリソースを最大限に活用し、LLMの学習をより速く、効率的に進めるための重要な進歩です。開発中に技術的な課題もありましたが、モデルの学習品質を維持したまま効率を上げられることが大きな利点です。 引用元: https://huggingface.co/blog/vllm-colocate Claude 4(Opus・Sonnet)とは?使い方や料金プロンプトのコツを解説 Anthropic社から、新しい高性能AIモデル「Claude 4」が登場しました。これは「モデルファミリー」として提供され、特に「Opus」と「Sonnet」という主要なモデルがあります。日本の新人エンジニアの皆さんがAIの選定や活用を考える上で、このClaude 4を知っておくと役立ちます。 「Claude 4 Opus」は最も賢く高性能なフラッグシップモデルで、特に複雑なコーディングや高度な推論、長期的なタスクが得意です。一方、「Claude 4 Sonnet」は高性能ながらも応答速度が速く、コスト効率が良いバランスの取れたモデルです。普段の業務や簡単な開発支援にはSonnet、より難易度の高い課題にはOpusと使い分けるのがおすすめです。無料ユーザーでもSonnetの一部機能は試せます。 Claude 4の大きな特徴は、その高いコーディング能力です。特にOpusは「世界最高のコーディングモデル」を目指しており、GitHubのIssue解決のような実際の開発タスクで高い精度を示しています。Sonnetも大幅に進化し、GitHub Copilotの基盤モデルにも採用されています。 また、賢く考えるための新しい仕組みもあります。質問に応じて素早く答えるモードと、時間をかけてじっくり考える「拡張思考モード」があり、このモードではWeb検索などの外部ツールも使ってより正確な答えを出すことができます(ベータ版)。開発者が許可すれば、過去のやり取りやファイル内容を「メモリ」として覚えておける機能も進化し、長期的なプロジェクトでの一貫性が向上しました。 開発者向けには、「Claude Code」というツールも登場しました。これはVS CodeやJetBrainsなどの開発環境(IDE)と連携してコード作成や修正を助けてくれます。SDKを使えば独自のAIエージェントを開発したり、GitHub連携でコードレビューや修正を自動化したりといったことも可能になりました。APIも強化され、モデルにコードを実行させたり、外部システムと連携させたりする機能が追加されています。 他の主要なAIモデル(GPT-4.1やGemini 2.5 Proなど)と比較すると、Claude 4はコーディングや推論のベンチマークで高いスコアを出しており、これらの分野で強みを持っています。ただし、画像や音声なども扱うマルチモーダル機能では他のモデルが進んでいる部分もあります。どのモデルを選ぶかは、皆さんがどんな作業にAIを使いたいかによって最適なものが変わってきます。 Claude 4は、公式ウェブサイト(claude.ai)で手軽に試せるほか、CursorエディタやGitHub Copilot、主要なクラウドプラットフォーム(Google Cloud Vertex AI, Amazon Bedrock)からも利用できます。 AIを効果的に使うには、プロンプト(AIへの指示)の仕方が重要です。Claude 4に明確で具体的な指示を与え、目的や背景を伝え、期待する出力形式を示すことで、より良い結果が得られます。例を見せたり、XMLタグを使ったりといった工夫も効果的です。 Claude 4は、開発作業の効率化や新しいアイデアの実現を助けてくれる強力なツールです。まずは無料
2025-06-0300 minDTA podcast2025-05-1608 minThe Newbie Gains Podcast2025-05-0517 minDTA podcast2025-05-0220 minDTA podcast2025-04-2617 minDTA podcast2025-03-2130 minDTA podcast2025-03-1411 minDTA podcast2025-03-0716 minDTA podcast2025-02-2819 minWie wir ticken - Euer Psychologie Podcast2025-02-2826 minDental Trade Alliance2024-12-0911 minDental Trade Alliance2024-11-0713 minDental Trade Alliance2024-11-0414 minDental Trade Alliance2024-10-2413 minThe Automation & Robotics Podcast2024-09-3041 minDental Trade Alliance2024-09-2615 minThe Newbie Gains Podcast2024-09-2616 minThe Newbie Gains Podcast2024-09-2417 minThe Newbie Gains Podcast2024-09-0235 minDental Trade Alliance2024-06-2613 minDental Trade Alliance2024-06-2608 minThe GaryVee Audio Experience2024-05-2739 minThe GaryVee Audio Experience2024-05-261h 02Gubmint Name Podcast2024-05-202h 16The Newbie Gains Podcast2024-04-2119 minThe Jaybefaunt Show2023-12-242h 30Beyond the Bulletin Podcast2023-12-0128 minThe Ninehertz Podcast2023-11-101h 07Expat Chat Podcast2023-09-2618 minHealth Law2023-08-3109 minTherapist Deserve Abundance2023-06-2117 minTravMagazine: De Podcast2023-03-2333 minDTA LIVE2022-12-2042 minExpat Chat Podcast2022-11-2816 minTeus&Tons Podcast2022-11-041h 07Teus&Tons Podcast2022-11-0452 minHealth Law2022-10-2705 minThe Newbie Gains Podcast2022-07-2520 minDTx Podcast with Eugene Borukhovich2022-05-1934 minTravMagazine: De Podcast2022-04-0138 minDon\'t Turn Around2022-02-242h 17Kilas Kabar Nusantara2021-12-1902 minPodcast Panela de Pressão2021-11-2907 minLa incógnita de lo incierto2021-11-261h 30The Brain Pop Podcast2021-10-2553 minThe DRich Show2021-10-1423 minDTA LIVE2021-08-1257 minDTA Podcast2021-05-231h 42DTA Podcast2021-04-111h 46Therapist Deserve Abundance2021-03-3142 minTherapist Deserve Abundance2021-03-3142 minTherapist Deserve Abundance2021-03-3055 minTherapist Deserve Abundance2021-03-3055 minDTA Podcast2021-03-211h 33DTA Podcast2021-03-071h 14Therapist Deserve Abundance2021-02-2616 minTherapist Deserve Abundance2021-02-2616 minTherapist Deserve Abundance2021-02-2319 minTherapist Deserve Abundance2021-02-2319 minDTA Podcast2021-02-191h 19Therapist Deserve Abundance2021-02-1020 minTherapist Deserve Abundance2021-02-1020 minDTA Podcast2021-02-051h 37DTA Podcast2021-01-141h 17Institut Moderní Výživy podcast2021-01-0744 minDTA Podcast2021-01-011h 16DTA Podcast2020-12-241h 07DTA Podcast2020-12-101h 15DTA Podcast2020-12-0355 minDTA Podcast2020-11-2700 minJeremy Mills Podcast2020-10-281h 06Therapist Deserve Abundance2020-09-2113 minDTA LIVE2020-06-1146 minDTong Radio Indie Music Showcase2020-03-101h 55DTong Radio Indie Music Showcase2020-03-081h 51DTA LIVE2020-01-0700 minDTA LIVE2020-01-0756 minDarkartadearmy2019-11-243h 40Darkartadearmy2019-10-2613 minDarkartadearmy2019-10-1917 minMarketScale Radio2019-07-0324 minMarketScale Radio2019-06-0640 minEverything Horror Podcast2019-06-011h 14Darkar Tade Podcast by Axn Sadokpam2019-03-0121 minDigital Health Today 360 with Dan Kendall2019-02-2833 minFutureDose.tech2018-12-1223 minFinance & Fury Podcast2018-06-2416 minSmall Arms Survey podcasts2017-07-2417 minDown the Aisle Wrestling Podcast – Sports Podcasting Network2015-12-1700 minDown the Aisle Wrestling Podcast – Sports Podcasting Network2015-12-1729 minPrecision Rifle Podcast2015-04-2343 minPodcast Dat Metal Podcast2013-04-041h 13