Look for any podcast host, guest or anyone

Showing episodes and shows of

Sungyee Chang

Shows

1st

1st (단단한 강화학습) 17 프론티어 - 강화학습의 미래 프론티어와 새로운 도전 과제 - 세상을_예측하고_계획하는_AI와_보상_설계(단단한 강화학습) 17 프론티어 - 강화학습의 미래 프론티어와 새로운 도전 과제 - 세상을_예측하고_계획하는_AI와_보상_설계

2026-02-1115 min

1st

1st (Grokking_DRL) 13장_Toward_artificial_general_intelligence - 심층 강화학습의 정수와 범용 인공지능의 미래 - 심층_강화_학습과_스스로_진화하는_AGI(Grokking_DRL) 13장_Toward_artificial_general_intelligence - 심층 강화학습의 정수와 범용 인공지능의 미래 - 심층_강화_학습과_스스로_진화하는_AGI

2026-02-1114 min

1st

1st (Grokking_DRL) 12장_Advanced_actor_critic_methods - 심층 강화학습의 최첨단 액터-크리틱 기법 - DDPG부터_PPO까지_고급_행위자_비평가_알고리즘(Grokking_DRL) 12장_Advanced_actor_critic_methods - 심층 강화학습의 최첨단 액터-크리틱 기법 - DDPG부터_PPO까지_고급_행위자_비평가_알고리즘

2026-02-1117 min

1st

1st (Grokking_DRL) 11장_Policy_gradient_and_actor_critic_methods - 심층 강화학습 정책 경사 및 액터-크리틱 기법 - 정책_경사에서_액터_크리틱으로의_진화(Grokking_DRL) 11장_Policy_gradient_and_actor_critic_methods - 심층 강화학습 정책 경사 및 액터-크리틱 기법 - 정책_경사에서_액터_크리틱으로의_진화

2026-02-1119 min

1st

1st (Grokking_DRL) 10장_Sample_efficient_value_based_methods - 효율적 샘플링을 위한 가치 기반 강화학습 기법 - 가치를_분리하고_놀라움을_배우는_듀얼링_AI(Grokking_DRL) 10장_Sample_efficient_value_based_methods - 효율적 샘플링을 위한 가치 기반 강화학습 기법 - 가치를_분리하고_놀라움을_배우는_듀얼링_AI

2026-02-1114 min

1st

1st (Grokking_DRL) 06장_Improving_agents__behaviors - 강화학습 에이전트의 행동 개선과 제어 문제 해결 - 지도_없이_시행착오로_최적_행동_찾기(Grokking_DRL) 06장_Improving_agents__behaviors - 강화학습 에이전트의 행동 개선과 제어 문제 해결 - 지도_없이_시행착오로_최적_행동_찾기

2026-02-1017 min

1st

1st (Grokking_DRL) 05장_Evaluating_agents__behaviors - 강화학습 에이전트의 가치 함수 추정과 정책 평가 기술 - 끝까지_가보는_MC와_한_걸음_예측하는_TD(Grokking_DRL) 05장_Evaluating_agents__behaviors - 강화학습 에이전트의 가치 함수 추정과 정책 평가 기술 - 끝까지_가보는_MC와_한_걸음_예측하는_TD

2026-02-1015 min

1st

1st (Grokking_DRL) 04장_Balancing_the_gathering_and_use_of_information - 탐험과 이용의 균형 멀티 암드 밴딧 전략 - 후회_없는_선택을_위한_AI의_탐색_전략(Grokking_DRL) 04장_Balancing_the_gathering_and_use_of_information - 탐험과 이용의 균형 멀티 암드 밴딧 전략 - 후회_없는_선택을_위한_AI의_탐색_전략

2026-02-1014 min

1st

1st (Grokking_DRL) 03장_Balancing_immediate_and_long_term_goals - 강화학습의 정책 최적화와 가치 함수 추정 원리 - 계획_대신_평가와_개선으로_정책을_최적화하라(Grokking_DRL) 03장_Balancing_immediate_and_long_term_goals - 강화학습의 정책 최적화와 가치 함수 추정 원리 - 계획_대신_평가와_개선으로_정책을_최적화하라

2026-02-0915 min

1st

1st (Grokking_DRL) 02장_Mathematical_foundations_of_reinforcement_learning - 강화학습의 수학적 기초와 마르코프 결정 과정 - 불확실성을_이기는_인공지능의_수학적_전략(Grokking_DRL) 02장_Mathematical_foundations_of_reinforcement_learning - 강화학습의 수학적 기초와 마르코프 결정 과정 - 불확실성을_이기는_인공지능의_수학적_전략

2026-02-0914 min

1st

1st (Grokking_DRL) 01장_Introduction_to_deep_reinforcement_learning - 심층 강화학습의 기초와 핵심 개념 입문 - 시행착오로_기계의_직관을_만드는_심층_강화학습(Grokking_DRL) 01장_Introduction_to_deep_reinforcement_learning - 심층 강화학습의 기초와 핵심 개념 입문 - 시행착오로_기계의_직관을_만드는_심층_강화학습

2026-02-0917 min

1st

1st (강화학습) A Survey of Safe Reinforcement Learning and Constrained MDPs A Technical Survey on Single-Agent and Multi-Agent Safety - 안전 강화학습 및 제약 MDP 기술 동향 조사 - 절대_선을_넘지_않는_AI의_수학적_방패(강화학습) A Survey of Safe Reinforcement Learning and Constrained MDPs A Technical Survey on Single-Agent and Multi-Agent Safety - 안전 강화학습 및 제약 MDP 기술 동향 조사 - 절대_선을_넘지_않는_AI의_수학적_방패

2026-02-0815 min

1st

1st (강화학습) A Survey on Explainable Deep Reinforcement Learning - 설명 가능한 심층 강화 학습 연구 동향 및 방법론 - AI_블랙박스를_여는_기술은_양날의_검(강화학습) A Survey on Explainable Deep Reinforcement Learning - 설명 가능한 심층 강화 학습 연구 동향 및 방법론 - AI_블랙박스를_여는_기술은_양날의_검

2026-02-0814 min

1st

1st (강화학습) Taxonomy and Trends in Reinforcement Learning for Robotics and Control Systems A Structured Review - 로봇 및 제어 시스템을 위한 강화 학습 분류와 트렌드 - 시뮬레이션_천재_로봇이_현실에서_바보가_되는_이유(강화학습) Taxonomy and Trends in Reinforcement Learning for Robotics and Control Systems A Structured Review - 로봇 및 제어 시스템을 위한 강화 학습 분류와 트렌드 - 시뮬레이션_천재_로봇이_현실에서_바보가_되는_이유

2026-02-0815 min

1st

1st (강화학습) Reinforcement Learning Meets Large Language Models A Survey of Advancements and Applications Across the LLM Lifecycle - 강화학습 기반 거대언어모델의 발전과 활용에 관한 서베이 - 스스로_정답_검증하며_진화하는_AI_추론(강화학습) Reinforcement Learning Meets Large Language Models A Survey of Advancements and Applications Across the LLM Lifecycle - 강화학습 기반 거대언어모델의 발전과 활용에 관한 서베이 - 스스로_정답_검증하며_진화하는_AI_추론

2026-02-0816 min

1st

1st (강화학습) Reward Models in Deep Reinforcement Learning A Survey - 심층 강화학습 보상 모델의 체계적 고찰과 전망 - AI의_욕망을_설계하는_보상_모델링(강화학습) Reward Models in Deep Reinforcement Learning A Survey - 심층 강화학습 보상 모델의 체계적 고찰과 전망 - AI의_욕망을_설계하는_보상_모델링

2026-02-0816 min

1st

1st (강화학습) A Technical Survey of Reinforcement Learning Techniques for Large Language Models - LLM의 정렬과 추론 강화를 위한 강화학습 기술 동향 - 정렬을_넘어_추론_엔진으로_진화한_강화학습(강화학습) A Technical Survey of Reinforcement Learning Techniques for Large Language Models - LLM의 정렬과 추론 강화를 위한 강화학습 기술 동향 - 정렬을_넘어_추론_엔진으로_진화한_강화학습

2026-02-0816 min

1st

1st (단단한 강화학습) 16 적용 및 사례 연구 - 강화학습의 혁신적 사례와 실전 적용 연구 -스승_없이_스스로_인간을_초월한_강화학습(단단한 강화학습) 16 적용 및 사례 연구 - 강화학습의 혁신적 사례와 실전 적용 연구 -스승_없이_스스로_인간을_초월한_강화학습

2026-02-0714 min

1st

1st (단단한 강화학습) 15 신경과학 - 강화학습과 신경과학 도파민과 보상 예측 오류 학습 - 뇌는_도파민의_예측_오차로_학습한다(단단한 강화학습) 15 신경과학 - 강화학습과 신경과학 도파민과 보상 예측 오류 학습 - 뇌는_도파민의_예측_오차로_학습한다

2026-02-0716 min

1st

1st (단단한 강화학습) 14 심리학 - 강화학습과 심리학 동물 학습의 계산적 이해 - AI와_뇌가_공유하는_예측과_습관의_알고리즘(단단한 강화학습) 14 심리학 - 강화학습과 심리학 동물 학습의 계산적 이해 - AI와_뇌가_공유하는_예측과_습관의_알고리즘

2026-02-0715 min

1st

1st (DRL) A Survey Analyzing Generalization inDeep Reinforcement Learning - 심층 강화학습의 일반화 기술 분석 및 통합 가이드라인 - 심층_강화학습이_낯선_환경에서_무너지는_이유(DRL) A Survey Analyzing Generalization inDeep Reinforcement Learning - 심층 강화학습의 일반화 기술 분석 및 통합 가이드라인 - 심층_강화학습이_낯선_환경에서_무너지는_이유

2026-02-0718 min

1st

1st (DRL) A Brief Survey of Deep Reinforcement Learning - 심층 강화 학습의 흐름과 핵심 기술 개관 - 아타리와_알파고를_정복한_심층_강화_학습의_비밀(DRL) A Brief Survey of Deep Reinforcement Learning - 심층 강화 학습의 흐름과 핵심 기술 개관 - 아타리와_알파고를_정복한_심층_강화_학습의_비밀

2026-02-0715 min

1st

1st (DRL) An Introduction to Deep Reinforcement Learning - 심층 강화학습의 핵심 원리와 알고리즘 체계 -차원의_저주를_깬_딥러닝과_강화_학습의_만남(DRL) An Introduction to Deep Reinforcement Learning - 심층 강화학습의 핵심 원리와 알고리즘 체계 -차원의_저주를_깬_딥러닝과_강화_학습의_만남

2026-02-0716 min

1st

1st (DRL) Deep Reinforcement Learning An Overview - 심층 강화학습 핵심 이론과 산업별 응용 기술의 전망 - 치명적인_삼중고_뚫고_진화한_딥_강화학습(DRL) Deep Reinforcement Learning An Overview - 심층 강화학습 핵심 이론과 산업별 응용 기술의 전망 - 치명적인_삼중고_뚫고_진화한_딥_강화학습

2026-02-0716 min

1st

1st (단단한 강화학습) 13 정책 경사도 방법 - 정책 경사도 방법의 원리와 알고리즘 요약 - AI가_계산_대신_직관과_전략을_배우는_법(단단한 강화학습) 13 정책 경사도 방법 - 정책 경사도 방법의 원리와 알고리즘 요약 - AI가_계산_대신_직관과_전략을_배우는_법

2026-02-0614 min

1st

1st (단단한 강화학습) 12 적격 흔적 - 적격 흔적 강화학습의 통합과 도약 - 강화학습의_똑똑한_단기_기억_적격_흔적(단단한 강화학습) 12 적격 흔적 - 적격 흔적 강화학습의 통합과 도약 - 강화학습의_똑똑한_단기_기억_적격_흔적

2026-02-0613 min

1st

1st (단단한 강화학습) 11 근사를 활용한 비활성 정책 방법 - 근사를 활용한 비활성 정책 강화학습 - AI_시스템을_붕괴시키는_죽음의_삼중고(단단한 강화학습) 11 근사를 활용한 비활성 정책 방법 - 근사를 활용한 비활성 정책 강화학습 - AI_시스템을_붕괴시키는_죽음의_삼중고

2026-02-0615 min

1st

1st (단단한 강화학습) 10 근사를 적용한 활성 정책 제어 - 근사법을 적용한 활성 정책 제어와 평균 보상 - 함수_근사_제어와_할인율의_무용성(단단한 강화학습) 10 근사를 적용한 활성 정책 제어 - 근사법을 적용한 활성 정책 제어와 평균 보상 - 함수_근사_제어와_할인율의_무용성

2026-02-0616 min

1st

1st (단단한 강화학습) 09 근사를 이용한 활성 정책 예측 - 근사를 활용한 활성 정책 예측 학습 - 차원의_저주를_깨는_함수_근사(단단한 강화학습) 09 근사를 이용한 활성 정책 예측 - 근사를 활용한 활성 정책 예측 학습 - 차원의_저주를_깨는_함수_근사

2026-02-0620 min

1st

1st (단단한 강화학습) 08 표에 기반한 방법을 이용한 계획 및 학습 - 강화학습의 통합 계획과 학습의 상호작용 - 계획과_학습을_하나로_잇는_다이나-큐(단단한 강화학습) 08 표에 기반한 방법을 이용한 계획 및 학습 - 강화학습의 통합 계획과 학습의 상호작용 - 계획과_학습을_하나로_잇는_다이나-큐

2026-02-0618 min

1st

1st (단단한 강화학습) 07 n단계 부트스트랩 - n단계 부트스트랩 TD와 몬테카를로의 통합 - 시간_단계의_족쇄를_끊는_n단계_부트스트래핑(단단한 강화학습) 07 n단계 부트스트랩 - n단계 부트스트랩 TD와 몬테카를로의 통합 - 시간_단계의_족쇄를_끊는_n단계_부트스트래핑

2026-02-0413 min

1st

1st (단단한 강화학습) 06 시간차 학습 - 강화학습의 핵심 시간차 학습의 원리와 제어 - 현실주의자_Sarsa와_이상주의자_Q-러닝(단단한 강화학습) 06 시간차 학습 - 강화학습의 핵심 시간차 학습의 원리와 제어 - 현실주의자_Sarsa와_이상주의자_Q-러닝

2026-02-0416 min

1st

1st (단단한 강화학습) 05 몬테카를로 방법 - 몬테카를로 강화학습 경험을 통한 가치 함수와 제어 학습 - 설명서_없이_경험만으로_게임을_정복하는_몬테카를로(단단한 강화학습) 05 몬테카를로 방법 - 몬테카를로 강화학습 경험을 통한 가치 함수와 제어 학습 - 설명서_없이_경험만으로_게임을_정복하는_몬테카를로

2026-02-0416 min

1st

1st (단단한 강화학습) 04 동적 프로그래밍 - 동적 프로그래밍과 마르코프 결정 과정의 최적화 - 동적_계획법이_만드는_완벽한_지도와_나침반(단단한 강화학습) 04 동적 프로그래밍 - 동적 프로그래밍과 마르코프 결정 과정의 최적화 - 동적_계획법이_만드는_완벽한_지도와_나침반

2026-02-0414 min

1st

1st (강화학습) A Survey of Reinforcement Learning Algorithms for Dynamically Varying Environments - 동적 변화 환경을 위한 강화학습 알고리즘 조사 및 분석 - 규칙이_변하는_현실_속_강화_학습의_생존법(강화학습) A Survey of Reinforcement Learning Algorithms for Dynamically Varying Environments - 동적 변화 환경을 위한 강화학습 알고리즘 조사 및 분석 - 규칙이_변하는_현실_속_강화_학습의_생존법

2026-02-0416 min

1st

1st (강화학습) Reinforcement Learning A Survey - 강화학습 기술과 전망에 관한 종합 보고서 - 보상과_시행착오로_스스로_정답_찾는_강화_학습(강화학습) Reinforcement Learning A Survey - 강화학습 기술과 전망에 관한 종합 보고서 - 보상과_시행착오로_스스로_정답_찾는_강화_학습

2026-02-0418 min

1st

1st (강화학습) A Comprehensive Survey of Reinforcement Learning From Algorithms to Practical Challenges - 강화학습 알고리즘의 범주별 분석과 응용 사례 조사 - 시행착오와_보상으로_최적의_전략을_찾는_강화학습(강화학습) A Comprehensive Survey of Reinforcement Learning From Algorithms to Practical Challenges - 강화학습 알고리즘의 범주별 분석과 응용 사례 조사 - 시행착오와_보상으로_최적의_전략을_찾는_강화학습

2026-02-0416 min

1st

1st (단단한 강화학습) 03 유한 마르코프 결정 과정 - 유한 마르코프 결정 과정의 기초와 수식적 정의 - MDP와_가치_함수로_최적의_전략_찾기(단단한 강화학습) 03 유한 마르코프 결정 과정 - 유한 마르코프 결정 과정의 기초와 수식적 정의 - MDP와_가치_함수로_최적의_전략_찾기

2026-02-0316 min

1st

1st (단단한 강화학습) 02 다중 선택 - 다중 선택과 탐색 k-중 암드 밴딧 문제의 이해 - 슬롯머신으로_푸는_탐험과_활용의_딜레마(단단한 강화학습) 02 다중 선택 - 다중 선택과 탐색 k-중 암드 밴딧 문제의 이해 - 슬롯머신으로_푸는_탐험과_활용의_딜레마

2026-02-0317 min

1st

1st (단단한 강화학습) 1. 소개 - 강화학습의 원리와 역사적 기초 - 정답_없이_시행착오와_보상으로_배우는_강화학습(단단한 강화학습) 1. 소개 - 강화학습의 원리와 역사적 기초 - 정답_없이_시행착오와_보상으로_배우는_강화학습

2026-02-0313 min

1st

1st IR 질의확장 - Query Expansion in the Age of Pre-trained and Large Language Models A Comprehensive Survey - 언어 모델 기반 질의 확장 기술의 진화와 전망 - 숨은_의도까지_찾아내는_LLM_쿼리_확장IR 질의확장 - Query Expansion in the Age of Pre-trained and Large Language Models A Comprehensive Survey - 언어 모델 기반 질의 확장 기술의 진화와 전망 - 숨은_의도까지_찾아내는_LLM_쿼리_확장

2026-02-0211 min

1st

1st IR 질의확장 - Query2doc Query Expansion with Large Language Models - Query2doc 거대 언어 모델을 활용한 쿼리 확장 검색 최적화 - AI_가상_문서로_검색_정확도_15__높이기IR 질의확장 - Query2doc Query Expansion with Large Language Models - Query2doc 거대 언어 모델을 활용한 쿼리 확장 검색 최적화 - AI_가상_문서로_검색_정확도_15__높이기

2026-02-0217 min

1st

1st IR 질의 확장 - A New Query Expansion Approach via Agent-Mediated Dialogic Inquiry - 소크라테스식 대화형 에이전트를 활용한 질의 확장 프레임워크 - 숨겨진_의도를_찾아내는_AI의_소크라테스식_자문자답IR 질의 확장 - A New Query Expansion Approach via Agent-Mediated Dialogic Inquiry - 소크라테스식 대화형 에이전트를 활용한 질의 확장 프레임워크 - 숨겨진_의도를_찾아내는_AI의_소크라테스식_자문자답

2026-02-0214 min

1st

1st 검색기 판독기 - RAG+체인 - A Systematic Review of Key Retrieval-Augmented Generation (RAG) Systems Progress, Gaps, and Future Directions -검색 증강 생성의 진화와 산업별 실무 적용 지침 - AI_환각_막는_RAG의_오픈북_기술검색기 판독기 - RAG+체인 - A Systematic Review of Key Retrieval-Augmented Generation (RAG) Systems Progress, Gaps, and Future Directions -검색 증강 생성의 진화와 산업별 실무 적용 지침 - AI_환각_막는_RAG의_오픈북_기술

2026-02-0213 min

1st

1st 검색기 판독기 - RAG확장 - A Survey on Retrieval-Augmented Text Generation for Large Language Models -거대언어모델의 검색 증강 생성 기술 프레임워크와 동향 연구 - AI_답변_뒤에_숨겨진_RAG의_정교한_엔지니어링검색기 판독기 - RAG확장 - A Survey on Retrieval-Augmented Text Generation for Large Language Models -거대언어모델의 검색 증강 생성 기술 프레임워크와 동향 연구 - AI_답변_뒤에_숨겨진_RAG의_정교한_엔지니어링

2026-02-0213 min

1st

1st 검색기 판독기 - RAG - Retrieval-Augmented Generation for Large Language Models A Survey -검색 증강 생성의 진화 RAG 기술 및 패러다임 총괄 탐구 - 실시간_정보로_환각_잡는_RAG의_진화검색기 판독기 - RAG - Retrieval-Augmented Generation for Large Language Models A Survey -검색 증강 생성의 진화 RAG 기술 및 패러다임 총괄 탐구 - 실시간_정보로_환각_잡는_RAG의_진화

2026-02-0218 min

1st

1st 검색기 판독기 - DPR - 밀집 구절 리트리버 오픈 도메인 질의응답의 혁신 -단어의_덫을_깨고_의미를_찾는_DPR검색기 판독기 - DPR - 밀집 구절 리트리버 오픈 도메인 질의응답의 혁신 -단어의_덫을_깨고_의미를_찾는_DPR

2026-02-0213 min

1st

1st 11. LLMs are Also Effective Embedding Models An In-depth Overview - 거대언어모델의 임베딩 모델 활용 전략과 전망 - BERT를_밀어낸_LLM_임베딩의_두_전략11. LLMs are Also Effective Embedding Models An In-depth Overview - 거대언어모델의 임베딩 모델 활용 전략과 전망 - BERT를_밀어낸_LLM_임베딩의_두_전략

2026-02-0213 min

1st

1st 11. Word Embeddings A Survey - 워드 임베딩 기술 및 전략에 관한 통합 서베이 - 왕에서_남자를_빼면_여왕이_나오는_이유11. Word Embeddings A Survey - 워드 임베딩 기술 및 전략에 관한 통합 서베이 - 왕에서_남자를_빼면_여왕이_나오는_이유

2026-02-0214 min

1st

1st 11.4 임베딩모델 파인튜닝 - Sentence-BERT Sentence Embeddings using Siamese BERT-Networks - 샴_네트워크로_65시간을_5초로_줄인_SBERT11.4 임베딩모델 파인튜닝 - Sentence-BERT Sentence Embeddings using Siamese BERT-Networks - 샴_네트워크로_65시간을_5초로_줄인_SBERT

2026-02-0213 min

1st

1st 10.4.2 도구 - Easytool Enhancing llm-based agents with concise tool instruction - AI_성능을_극대화하는_도구_설명서_정제법10.4.2 도구 - Easytool Enhancing llm-based agents with concise tool instruction - AI_성능을_극대화하는_도구_설명서_정제법

2026-02-0215 min

1st

1st 11.8 A Comprehensive Survey on Vector Database Storage and Retrieval Technique, Challenge - AI에게_장기_기억을_심어주는_벡터_DB11.8 A Comprehensive Survey on Vector Database Storage and Retrieval Technique, Challenge - AI에게_장기_기억을_심어주는_벡터_DB

2026-02-0216 min

1st

1st 11.8 벡터 데이터베이스 - Survey of Vector Database Management Systems - 벡터_DB_핵심_기술_HNSW와_시스템_선택11.8 벡터 데이터베이스 - Survey of Vector Database Management Systems - 벡터_DB_핵심_기술_HNSW와_시스템_선택

2026-02-0216 min

1st

1st 13.1.1 LLM 캐스케이브 - Optimising Calls to Large Language Models with Uncertainty-Based Two-Tier Selection - 마진_샘플링으로_LLM_비용과_성능_동시_해결13.1.1 LLM 캐스케이브 - Optimising Calls to Large Language Models with Uncertainty-Based Two-Tier Selection - 마진_샘플링으로_LLM_비용과_성능_동시_해결

2026-02-0114 min

1st

1st 13.1 다중 LLM 아키텍처 = LLM-Blender Ensembling Large Language Models with Pairwise Ranking and Generative Fusion - 여러_AI_섞어_최상의_답변_만드는_기술13.1 다중 LLM 아키텍처 = LLM-Blender Ensembling Large Language Models with Pairwise Ranking and Generative Fusion - 여러_AI_섞어_최상의_답변_만드는_기술

2026-02-0114 min

1st

1st 12.10 RAG 대 파인튜닝 - Fine-Tuning or Retrieval Comparing Knowledge Injection in LLMs - 새로운_지식_주입은_미세조정보다_RAG가_압승12.10 RAG 대 파인튜닝 - Fine-Tuning or Retrieval Comparing Knowledge Injection in LLMs - 새로운_지식_주입은_미세조정보다_RAG가_압승

2026-02-0116 min

1st

1st 12.8 RAG의 한계 - RECALL A Benchmark for LLMs Robustness against External Counterfactual Knowledge - 정답을_알고도_틀린_검색_결과에_굴복하는_AI12.8 RAG의 한계 - RECALL A Benchmark for LLMs Robustness against External Counterfactual Knowledge - 정답을_알고도_틀린_검색_결과에_굴복하는_AI

2026-02-0114 min

1st

1st 12.6 RAG로 인컨텍스트 학습 예시 선택 - Learning to Retrieve In-Context Examples for Large Language Models - 스스로_최적의_학습_예시_찾는_LLM-R12.6 RAG로 인컨텍스트 학습 예시 선택 - Learning to Retrieve In-Context Examples for Large Language Models - 스스로_최적의_학습_예시_찾는_LLM-R

2026-02-0117 min

1st

1st 12.4.6 RAG 파이프라인 - 생성 - Active Retrieval Augmented Generation - 글_쓰다_막히면_스스로_검색하는_AI12.4.6 RAG 파이프라인 - 생성 - Active Retrieval Augmented Generation - 글_쓰다_막히면_스스로_검색하는_AI

2026-02-0114 min

1st

1st 12.4.5 RAG 파이프라인 - 삽입 - Lost in the Middle How Language Models Use Long Contexts - 정보가_많을수록_멍청해지는_LLM의_역설12.4.5 RAG 파이프라인 - 삽입 - Lost in the Middle How Language Models Use Long Contexts - 정보가_많을수록_멍청해지는_LLM의_역설

2026-02-0115 min

1st

1st 12.4.4 RAG 파이프라인 - 정제 - Chain-of-Note Enhancing Robustness in Retrieval-Augmented Language Models - 스스로_팩트체크하는_AI의_메모_습관12.4.4 RAG 파이프라인 - 정제 - Chain-of-Note Enhancing Robustness in Retrieval-Augmented Language Models - 스스로_팩트체크하는_AI의_메모_습관

2026-02-0114 min

1st

1st 12.4.4 RAG 파이프라인 - 정제 - RECOMP Improving Retrieval-Augmented LMs with Compression and Selective Augmentation - 문서_94_를_버려야_RAG가_똑똑해진다12.4.4 RAG 파이프라인 - 정제 - RECOMP Improving Retrieval-Augmented LMs with Compression and Selective Augmentation - 문서_94_를_버려야_RAG가_똑똑해진다

2026-02-0114 min

1st

1st 12.4.3 RAG 파이프라인 - 리랭크 - RankZephyr Effective and Robust Zero-Shot Listwise Reranking is a Breeze! - GPT-4_이긴_70억_재순위_모델_랭크제퍼12.4.3 RAG 파이프라인 - 리랭크 - RankZephyr Effective and Robust Zero-Shot Listwise Reranking is a Breeze! - GPT-4_이긴_70억_재순위_모델_랭크제퍼

2026-02-0116 min

1st

1st 12.4.3 RAG 파이프라인 - 리랭크 - RankVicuna Zero-Shot Listwise Document Reranking with Open-Source Large Language Models - GPT-4_성능_따라잡은_70억_오픈소스_랭크비쿠냐12.4.3 RAG 파이프라인 - 리랭크 - RankVicuna Zero-Shot Listwise Document Reranking with Open-Source Large Language Models - GPT-4_성능_따라잡은_70억_오픈소스_랭크비쿠냐

2026-02-0116 min

1st

1st 12.4.3 RAG 파이프라인 - 리랭크 - Is ChatGPT Good at Search Investigating Large Language Models as Re-Ranking Agents - ChatGPT_검색_순위_능력을_흡수한_초소형_모델12.4.3 RAG 파이프라인 - 리랭크 - Is ChatGPT Good at Search Investigating Large Language Models as Re-Ranking Agents - ChatGPT_검색_순위_능력을_흡수한_초소형_모델

2026-02-0112 min

1st

1st 12.4.3 RAG 파이프라인 - 리랭크 - Strategies for Effective and Efficient Text Ranking Using Large Language Models - 순위_매기기로_본_LLM의_치명적_약점12.4.3 RAG 파이프라인 - 리랭크 - Strategies for Effective and Efficient Text Ranking Using Large Language Models - 순위_매기기로_본_LLM의_치명적_약점

2026-02-0114 min

1st

1st 12.4.3 RAG 파이프라인 - 리랭크 - Open-source Large Language Models are Strong Zero-shot Query Likelihood Models for Document Ranking - 문서_순위,_지시_튜닝은_오히려_독이_된다12.4.3 RAG 파이프라인 - 리랭크 - Open-source Large Language Models are Strong Zero-shot Query Likelihood Models for Document Ranking - 문서_순위,_지시_튜닝은_오히려_독이_된다

2026-02-0111 min

1st

1st 12.4.3 RAG 파이프라인 - 리랭크 - ColBERT Efficient and Effective Passage Search via Contextualized Late Interaction over BERT - BERT보다_170배_빠른_검색_모델_ColBERT12.4.3 RAG 파이프라인 - 리랭크 - ColBERT Efficient and Effective Passage Search via Contextualized Late Interaction over BERT - BERT보다_170배_빠른_검색_모델_ColBERT

2026-02-0113 min

1st

1st 12.4.2 RAG 파이프라인 - 검색 - A Multi-Task Embedder For Retrieval Augmented LLMs - 유사성_대신_유용성을_학습한_만능_검색기12.4.2 RAG 파이프라인 - 검색 - A Multi-Task Embedder For Retrieval Augmented LLMs - 유사성_대신_유용성을_학습한_만능_검색기

2026-02-0113 min

1st

1st 12.4.2 RAG 파이프라인 - 검색 - Generative Retrieval with Few-shot Indexing - 훈련_필요_없는_퓨샷_생성형_검색12.4.2 RAG 파이프라인 - 검색 - Generative Retrieval with Few-shot Indexing - 훈련_필요_없는_퓨샷_생성형_검색

2026-02-0115 min

1st

1st 12.4.2 RAG 파이프라인 - 검색 - Transformer Memory as a Differentiable Search Index - 문서를_암기해_검색_인덱스가_된_구글_DSI12.4.2 RAG 파이프라인 - 검색 - Transformer Memory as a Differentiable Search Index - 문서를_암기해_검색_인덱스가_된_구글_DSI

2026-02-0115 min

1st

1st 12.4.2 RAG 파이프라인 - 검색 - How Does Generative Retrieval Scale to Millions of Passages - 생성적_검색_성능은_모델이_클수록_떨어졌다12.4.2 RAG 파이프라인 - 검색 - How Does Generative Retrieval Scale to Millions of Passages - 생성적_검색_성능은_모델이_클수록_떨어졌다

2026-02-0115 min

1st

1st 12.4.1 RAG 파이프라인 - 재작성 - Can Query Expansion Improve Generalization of Strong Cross-Encoder Rankers - 검색어를_더할수록_AI가_멍청해지는_이유12.4.1 RAG 파이프라인 - 재작성 - Can Query Expansion Improve Generalization of Strong Cross-Encoder Rankers - 검색어를_더할수록_AI가_멍청해지는_이유

2026-02-0117 min

1st

1st 12.4.1 Precise Zero-Shot Dense Retrieval without Relevance Labels - 가짜_답안을_지어내_진짜_정보를_찾는_HyDE12.4.1 Precise Zero-Shot Dense Retrieval without Relevance Labels - 가짜_답안을_지어내_진짜_정보를_찾는_HyDE

2026-01-3112 min

1st

1st 12.4.1 Query2doc Query Expansion with Large Language Models - LLM_가상_문서로_애매한_검색어_확장하기12.4.1 Query2doc Query Expansion with Large Language Models - LLM_가상_문서로_애매한_검색어_확장하기

2026-01-3114 min

1st

1st 12.3 When Not to Trust Language Models Investigating Effectiveness of Parametric and Non-Parametric Memories - 인기도_낮은_지식만_검색하는_AI_적응형_전략12.3 When Not to Trust Language Models Investigating Effectiveness of Parametric and Non-Parametric Memories - 인기도_낮은_지식만_검색하는_AI_적응형_전략

2026-01-3115 min

1st

1st 12.1 Measuring Forgetting of Memorized Training Examples - AI의_기억을_지우는_범인은_무작위성12.1 Measuring Forgetting of Memorized Training Examples - AI의_기억을_지우는_범인은_무작위성

2026-01-3116 min

1st

1st 12.1 Large Language Models Struggle to Learn Long-Tail Knowledge12.1 Large Language Models Struggle to Learn Long-Tail Knowledge

2026-01-3115 min

1st

1st 11.9 Prism mapping interpretable concepts and features in a latent space of language11.9 Prism mapping interpretable concepts and features in a latent space of language

2026-01-3114 min

1st

1st 11.9 An Intuitive Explanation of Sparse Autoencoders for LLM Interpretability11.9 An Intuitive Explanation of Sparse Autoencoders for LLM Interpretability

2026-01-3114 min

1st

1st 11.6.1 2D Matryoshka Sentence Embddings11.6.1 2D Matryoshka Sentence Embddings

2026-01-3114 min

1st

1st 11.5 MTEB Massive Text Embedding Benchmark11.5 MTEB Massive Text Embedding Benchmark

2026-01-3015 min

1st

1st 11.5 Description-Based Text Similarity11.5 Description-Based Text Similarity

2026-01-3015 min

1st

1st 11.4.3 Problems with Cosine as a Measure of Embedding Similarity for High Frequency Words11.4.3 Problems with Cosine as a Measure of Embedding Similarity for High Frequency Words

2026-01-3019 min

1st

1st 11.4.2 NV-Retriever Improving text embedding models with effective hard-negative mining11.4.2 NV-Retriever Improving text embedding models with effective hard-negative mining

2026-01-3014 min

1st

1st 10.4.6 AssistantBench Can Web Agents Solve Realistic and Time-Consuming Tasks10.4.6 AssistantBench Can Web Agents Solve Realistic and Time-Consuming Tasks

2026-01-3015 min

1st

1st 10.4.6 The Dawn of GUI Agent A Preliminary Case Study with Claude 3.5 Computer Use10.4.6 The Dawn of GUI Agent A Preliminary Case Study with Claude 3.5 Computer Use

2026-01-3015 min

1st

1st 10.4.4 Reflexion Language Agents with Verbal Reinforcement Learning10.4.4 Reflexion Language Agents with Verbal Reinforcement Learning

2026-01-3016 min

1st

1st 10.4.4 On the Brittle Foundations of ReAct Prompting for Agentic Large Language Models10.4.4 On the Brittle Foundations of ReAct Prompting for Agentic Large Language Models

2026-01-3013 min

1st

1st 10.4.2 ToolLLM Facilitating Large Language Models to Master 16000+ Real-world APIs10.4.2 ToolLLM Facilitating Large Language Models to Master 16000+ Real-world APIs

2026-01-3016 min

1st

1st 10.4.1 Symbolic Planning and Code Generation for Grounded Dialogue10.4.1 Symbolic Planning and Code Generation for Grounded Dialogue

2026-01-3012 min

1st

1st 9.2 추론 최적화 A Survey on Efficient Inference for Large Language Models9.2 추론 최적화 A Survey on Efficient Inference for Large Language Models

2026-01-2915 min

1st

1st 8.8 추론 유도 SkunkworksAIreasoning-0.018.8 추론 유도 SkunkworksAI/reasoning-0.01

2026-01-2916 min

1st

1st 8.8 추론 유도 The Impact of Reasoning Step Length on Large Language Models8.8 추론 유도 The Impact of Reasoning Step Length on Large Language Models

2026-01-2912 min

1st

1st 8.8 추론 유도 LLMs Can't Plan, But Can Help Planning in LLM-Modulo Frameworks8.8 추론 유도 LLMs Can't Plan, But Can Help Planning in LLM-Modulo Frameworks

2026-01-2915 min

1st

1st 8.7 추론 Inductive or Deductive Rethinking the Fundamental Reasoning Abilities of LLMs8.7 추론 Inductive or Deductive? Rethinking the Fundamental Reasoning Abilities of LLMs

2026-01-2915 min

1st

1st 8.7 추론 Faith and Fate Transformers as fuzzy pattern matchers8.7 추론 Faith and Fate: Transformers as fuzzy pattern matchers

2026-01-2915 min

1st

1st 8.7 추론 Faith and Fate Limits of Transformers on Compositionality8.7 추론 Faith and Fate: Limits of Transformers on Compositionality

2026-01-2915 min

1st

1st 8.7 추론 Natural Language Reasoning, A Survey8.7 추론 Natural Language Reasoning, A Survey

2026-01-2917 min

1st

1st 8. A General Language Assistant as a Laboratory for Alignment2

2026-01-2914 min