Look for any podcast host, guest or anyone
Showing episodes and shows of

Alex Qian

Shows

Radioaktiv Podcast2025-12-0733 min科技前緣
科技前緣Apple 的 AI 新戰略:Pico-Banana-400K 如何訓練 AI 像人類一樣編輯圖像?🎙️ 摘要 (Summary) Apple 最近發布了一篇新論文,公開了大型數據集 Pico-Banana-400K,旨在訓練 AI 像人類一樣進行圖像編輯。這個數據集包含約 40 萬個高品質、基於真實圖像的文本引導編輯範例。該研究採用創新的 MLLM 驅動品質控制流程,使用 Nano-Banana 進行編輯,並由 Gemini 2.5 Pro 擔任自動評審。數據集提供了多輪編輯序列 (72K) 和偏好對 (56K),是推進 AI 對齊和複雜編輯研究的強大基礎。研究結果顯示,雖然 AI 在全局風格轉換上表現優秀(成功率達 93%),但在精確的空間操作(如移動物體和文字編輯)方面仍面臨嚴峻挑戰,成功率不到 60%。該數據集已在 Apple 研究許可下完全開源。 📌 Keypoint (重點) Apple 的 AI 戰略與圖像編輯: Apple 推出此研究,可能與未來 Apple Intelligence 接收指令編輯圖像(如透過 Siri 裁剪或調整)的傳聞有關。該公司目前在 AI 圖像編輯領域感覺落後於 Google 和 Samsung 等主要競爭對手。 數據集核心特徵: Pico-Banana-400K 包含約 40 萬個編輯範例,全部基於 Open Images 的真實照片,以避免合成數據的領域偏移問題。它涵蓋了 8 個語義類別下的 35 種詳細編輯操作。 創新品質控制流程: 該數據集使用 Nano-Banana 模型生成編輯結果,並使用 Gemini 2.5 Pro 作為自動評審進行品質篩選,分數必須高於約 0.7 的嚴格門檻才能被視為成功。評審標準中,指令遵循度(Instruction Compliance)的權重最高,佔 40%。 進階研究子集: 數據集包含 7.2 萬個多輪序列,用於訓練迭代細化和規劃;另有 5.6 萬組偏好對(成功 vs. 失敗範例),適用於 DPO(直接偏好優化)等對齊訓練方法。 當前 AI 模型的局限性: 測試結果顯示,全局性的風格或外觀調整(如藝術風格轉換)成功率高達 93%;但涉及精確幾何或空間控制的任務,如移動物體(59%)或改變可見文字的字體/顏色(57%),成功率極低。這突顯了對幾何感知訓練目標的迫切需求。 開源與未來展望: Pico-Banana-400K 已根據 Apple 的研究許可開源,為研究界提供了下一代文本引導圖像編輯模型所需的數據基礎。這與 Apple 希望讓小型模型在本地 iPhone 上運行的經濟和隱私策略相符。 📚 參考文獻 (Citations) 名稱: Pico-Banana-400K: A Large-Scale Dataset for Text-Guided Image Editing 作者: Yusu Qian, Eli Bocek-Rivele, Liangchen Song, Jialing Tong, Yinfei Yang, Jiasen Lu, Wenze Hu, Zhe Gan 日期: 2025 年 10 月 22 日 來源: arXiv:2510.19808 名稱: Apple Is Teaching AI To Edit Photos The Way Humans Do 作者: José Adorno 日期: 2025 年 10 月 30 日 來源: BGR 名稱: Apple's New AI Dataset Aims to Improve Photo Editing Models 作者: Tim Hardwick 日期: 2025 年 10 月 29 日 來源: MacRumors 名稱: Apple doing Open Source things 作者: Consistent_Wash_276 (引用自 @alex_prompter on x) 日期: 2025 年 10 月 30 日 (Reddit 貼文日期) 來源: Reddit r/LocalLLM 名稱: GitHub - apple/pico-banana-400k 作者: Apple 日期: 無日期(GitHub 儲存庫) 來源: GitHub 💬 聲明稿 (Disclaimer) "本頻道所有內容均為我的個人觀點與分析,不代表我現任或曾任職公司的立場。所有資訊均來自公開管道,不涉及任何內部或機密資訊。" (Disclaimer: The views and opinions expressed on this channel are my own and do not represent those of my employer. All information is based on publicly available sources.) Hastag #AppleAI #PicoBanana400K #圖像編輯 #人工智慧 #機器學習 #OpenSource #科技前緣 #NanoBanana #Gemini -- Hosting provided by SoundOn
2025-10-3123 minTechno Music2025-05-152h 00Music In Good Humor2025-05-152h 00Risk Parity Radio2024-10-2434 minThe Edge Podcast2024-09-2759 minThe CinePacks Podcast2024-08-141h 05Brave New World -- hosted by Vasant Dhar2024-04-041h 07The Real Story2024-02-0248 minUnexpected Elements2022-11-201h 01Welcome To The NFT Jungle2022-11-1826 minCool Hand Crypto2022-05-1749 minThe Paul Truesdell Podcast2022-03-1136 min迟早更新
迟早更新Episode 176: 行旅闲聊之光谱以外的人 关于更新的,也关于亘古不变的。 今日「两样」: 「建筑大王」 三得利 ROKU 日式六金酒 感谢三得利对本期节目的赞助。大家如果对三得利 ROKU 日式六金酒感兴趣的话,可以点此查看,或在淘宝搜索「三得利酒类海外旗舰店」了解更多信息。找客服报「迟早更新」领取节目专属优惠,有效时间为一个月。 👇 是短歌四首: Show Notes: 播客《所建所闻》的网站 四川省唐家河国家级自然保护区管理处的网站 Localand(成都)的文章《「地方记忆 +」系列展来了!》 中国科普研究所的报告《我国科普产业发展研究报告》 周源的文章《士子风骨与效法自然——谈王澍与象山校园三期工程》 付子洋的文章《王澍:一场 16 年的教改实验》 三文建筑的文章《山村烤烟房的艺术化重生——都团村公共服务中心》 孙云帆的文章《草色遥看近却无——碧山计划三年记》 日本 One Village One Product movement(一村一品運動)的维基百科页面 温铁军的演讲记录《乡村建设是避免经济危机的可能出路》 李厚辰的文章《自然保护与教育的另一面,一种「别样生活」的重塑》 上海广播电视台融媒体中心的节目《梦想改造家》的维基百科页面 《迟早更新》#96《开门:关于「装人的容器」》 新华网VR | 广元千佛崖 Natalie Wolchover 的文章《Why Are Moths Drawn to Artificial Lights?》 佛罗里达大西洋大学(Florida Atlantic University)天文观测台网站上的「光污染与昆虫」专题页面 Stanley Heinze 和 Steven M.Reppert 的文章《Sun Compass Integration of Skylight Cues in Migratory Monarch Butterflies》 李晨阳的文章《陈世骧:留下一张厚重的考卷》 陈世骧建立的中国科学院动物进化与系统学重点实验室鞘翅目形态与进化研究组的网页 白头鹎(Pycnonotus sinensis)的维基百科页面 加西亚·马尔克斯的书《百年孤独》 大森贵弘、出合小都美导演的动画连续剧《夏目友人帐》的网站 两面针(Zanthoxylum nitidum)的维基百科页面 益母草(Leonurus japonicus)的维基百科页面 夏枯草(Prunella vulgaris)的维基百科页面 中科院生态环境研究中心城市和区域生态国家重点实验室的文章《〈蚂蚁森林2016-2020年造林项目生态系统生产总值(GEP)核算报告〉正式发布》 静静的文章《蚂蚁森林如何帮助支付宝实现增长?》 巴蜗牛属(Bradybaena)的维基百科页面 孙海的文章《风之花,他说他迷恋过它……「微风玫瑰」银莲花这般吸引人!》 刘抗的文章《九溪有一种会「咬」人的草 安徒生童话〈野天鹅〉里出现过》 《为什么「荨」在「荨麻」中念 qián,而在「荨麻疹」念 xún?》的知乎问题页面 徐梅、陈必欣的文章《刘悦来:从缝隙到路径,四叶草堂的社区花园实践》 亚历克斯·加兰(Alex Garland)导演的电影《湮灭》(Annihilation)
2021-11-291h 14迟早更新
迟早更新Episode 176: 行旅闲聊之光谱以外的人 关于更新的,也关于亘古不变的。 今日「两样」: 「建筑大王」 三得利 ROKU 日式六金酒 感谢三得利对本期节目的赞助。大家如果对三得利 ROKU 日式六金酒感兴趣的话,可以点此查看,或在淘宝搜索「三得利酒类海外旗舰店」了解更多信息。找客服报「迟早更新」领取节目专属优惠,有效时间为一个月。 👇 是短歌四首: Show Notes: 播客《所建所闻》的网站 四川省唐家河国家级自然保护区管理处的网站 Localand(成都)的文章《「地方记忆 +」系列展来了!》 中国科普研究所的报告《我国科普产业发展研究报告》 周源的文章《士子风骨与效法自然——谈王澍与象山校园三期工程》 付子洋的文章《王澍:一场 16 年的教改实验》 三文建筑的文章《山村烤烟房的艺术化重生——都团村公共服务中心》 孙云帆的文章《草色遥看近却无——碧山计划三年记》 日本 One Village One Product movement(一村一品運動)的维基百科页面 温铁军的演讲记录《乡村建设是避免经济危机的可能出路》 李厚辰的文章《自然保护与教育的另一面,一种「别样生活」的重塑》 上海广播电视台融媒体中心的节目《梦想改造家》的维基百科页面 《迟早更新》#96《开门:关于「装人的容器」》 新华网VR | 广元千佛崖 Natalie Wolchover 的文章《Why Are Moths Drawn to Artificial Lights?》 佛罗里达大西洋大学(Florida Atlantic University)天文观测台网站上的「光污染与昆虫」专题页面 Stanley Heinze 和 Steven M.Reppert 的文章《Sun Compass Integration of Skylight Cues in Migratory Monarch Butterflies》 李晨阳的文章《陈世骧:留下一张厚重的考卷》 陈世骧建立的中国科学院动物进化与系统学重点实验室鞘翅目形态与进化研究组的网页 白头鹎(Pycnonotus sinensis)的维基百科页面 加西亚·马尔克斯的书《百年孤独》 大森贵弘、出合小都美导演的动画连续剧《夏目友人帐》的网站 两面针(Zanthoxylum nitidum)的维基百科页面 益母草(Leonurus japonicus)的维基百科页面 夏枯草(Prunella vulgaris)的维基百科页面 中科院生态环境研究中心城市和区域生态国家重点实验室的文章《〈蚂蚁森林2016-2020年造林项目生态系统生产总值(GEP)核算报告〉正式发布》 静静的文章《蚂蚁森林如何帮助支付宝实现增长?》 巴蜗牛属(Bradybaena)的维基百科页面 孙海的文章《风之花,他说他迷恋过它……「微风玫瑰」银莲花这般吸引人!》 刘抗的文章《九溪有一种会「咬」人的草 安徒生童话〈野天鹅〉里出现过》 《为什么「荨」在「荨麻」中念 qián,而在「荨麻疹」念 xún?》的知乎问题页面 徐梅、陈必欣的文章《刘悦来:从缝隙到路径,四叶草堂的社区花园实践》 亚历克斯·加兰(Alex Garland)导演的电影《湮灭》(Annihilation)
2021-11-291h 14Fantasy/Animation2021-11-221h 07Artful Mind2021-10-2058 minThe Sign R Podcast2021-09-291h 19Tom Rowland Podcast2021-03-171h 17China Stories2021-03-0906 minAxios Re:Cap2020-12-0920 min1 big thing2020-12-0820 minSkylum\'s Behind the Seen Podcast2020-05-1200 minThe Way Welling Podcast2019-12-251h 02The Pierre T. Lambert Podcast2019-07-0453 minMovies First: Film Reviews & Insights2018-06-1403 min