podcast
details
.com
Print
Share
Look for any podcast host, guest or anyone
Search
Showing episodes and shows of
Sungyee Chang
Shows
1st
(단단한 강화학습) 17 프론티어 - 강화학습의 미래 프론티어와 새로운 도전 과제 - 세상을_예측하고_계획하는_AI와_보상_설계
(단단한 강화학습) 17 프론티어 - 강화학습의 미래 프론티어와 새로운 도전 과제 - 세상을_예측하고_계획하는_AI와_보상_설계
2026-02-11
15 min
1st
(Grokking_DRL) 13장_Toward_artificial_general_intelligence - 심층 강화학습의 정수와 범용 인공지능의 미래 - 심층_강화_학습과_스스로_진화하는_AGI
(Grokking_DRL) 13장_Toward_artificial_general_intelligence - 심층 강화학습의 정수와 범용 인공지능의 미래 - 심층_강화_학습과_스스로_진화하는_AGI
2026-02-11
14 min
1st
(Grokking_DRL) 12장_Advanced_actor_critic_methods - 심층 강화학습의 최첨단 액터-크리틱 기법 - DDPG부터_PPO까지_고급_행위자_비평가_알고리즘
(Grokking_DRL) 12장_Advanced_actor_critic_methods - 심층 강화학습의 최첨단 액터-크리틱 기법 - DDPG부터_PPO까지_고급_행위자_비평가_알고리즘
2026-02-11
17 min
1st
(Grokking_DRL) 11장_Policy_gradient_and_actor_critic_methods - 심층 강화학습 정책 경사 및 액터-크리틱 기법 - 정책_경사에서_액터_크리틱으로의_진화
(Grokking_DRL) 11장_Policy_gradient_and_actor_critic_methods - 심층 강화학습 정책 경사 및 액터-크리틱 기법 - 정책_경사에서_액터_크리틱으로의_진화
2026-02-11
19 min
1st
(Grokking_DRL) 10장_Sample_efficient_value_based_methods - 효율적 샘플링을 위한 가치 기반 강화학습 기법 - 가치를_분리하고_놀라움을_배우는_듀얼링_AI
(Grokking_DRL) 10장_Sample_efficient_value_based_methods - 효율적 샘플링을 위한 가치 기반 강화학습 기법 - 가치를_분리하고_놀라움을_배우는_듀얼링_AI
2026-02-11
14 min
1st
(Grokking_DRL) 06장_Improving_agents__behaviors - 강화학습 에이전트의 행동 개선과 제어 문제 해결 - 지도_없이_시행착오로_최적_행동_찾기
(Grokking_DRL) 06장_Improving_agents__behaviors - 강화학습 에이전트의 행동 개선과 제어 문제 해결 - 지도_없이_시행착오로_최적_행동_찾기
2026-02-10
17 min
1st
(Grokking_DRL) 05장_Evaluating_agents__behaviors - 강화학습 에이전트의 가치 함수 추정과 정책 평가 기술 - 끝까지_가보는_MC와_한_걸음_예측하는_TD
(Grokking_DRL) 05장_Evaluating_agents__behaviors - 강화학습 에이전트의 가치 함수 추정과 정책 평가 기술 - 끝까지_가보는_MC와_한_걸음_예측하는_TD
2026-02-10
15 min
1st
(Grokking_DRL) 04장_Balancing_the_gathering_and_use_of_information - 탐험과 이용의 균형 멀티 암드 밴딧 전략 - 후회_없는_선택을_위한_AI의_탐색_전략
(Grokking_DRL) 04장_Balancing_the_gathering_and_use_of_information - 탐험과 이용의 균형 멀티 암드 밴딧 전략 - 후회_없는_선택을_위한_AI의_탐색_전략
2026-02-10
14 min
1st
(Grokking_DRL) 03장_Balancing_immediate_and_long_term_goals - 강화학습의 정책 최적화와 가치 함수 추정 원리 - 계획_대신_평가와_개선으로_정책을_최적화하라
(Grokking_DRL) 03장_Balancing_immediate_and_long_term_goals - 강화학습의 정책 최적화와 가치 함수 추정 원리 - 계획_대신_평가와_개선으로_정책을_최적화하라
2026-02-09
15 min
1st
(Grokking_DRL) 02장_Mathematical_foundations_of_reinforcement_learning - 강화학습의 수학적 기초와 마르코프 결정 과정 - 불확실성을_이기는_인공지능의_수학적_전략
(Grokking_DRL) 02장_Mathematical_foundations_of_reinforcement_learning - 강화학습의 수학적 기초와 마르코프 결정 과정 - 불확실성을_이기는_인공지능의_수학적_전략
2026-02-09
14 min
1st
(Grokking_DRL) 01장_Introduction_to_deep_reinforcement_learning - 심층 강화학습의 기초와 핵심 개념 입문 - 시행착오로_기계의_직관을_만드는_심층_강화학습
(Grokking_DRL) 01장_Introduction_to_deep_reinforcement_learning - 심층 강화학습의 기초와 핵심 개념 입문 - 시행착오로_기계의_직관을_만드는_심층_강화학습
2026-02-09
17 min
1st
(강화학습) A Survey of Safe Reinforcement Learning and Constrained MDPs A Technical Survey on Single-Agent and Multi-Agent Safety - 안전 강화학습 및 제약 MDP 기술 동향 조사 - 절대_선을_넘지_않는_AI의_수학적_방패
(강화학습) A Survey of Safe Reinforcement Learning and Constrained MDPs A Technical Survey on Single-Agent and Multi-Agent Safety - 안전 강화학습 및 제약 MDP 기술 동향 조사 - 절대_선을_넘지_않는_AI의_수학적_방패
2026-02-08
15 min
1st
(강화학습) A Survey on Explainable Deep Reinforcement Learning - 설명 가능한 심층 강화 학습 연구 동향 및 방법론 - AI_블랙박스를_여는_기술은_양날의_검
(강화학습) A Survey on Explainable Deep Reinforcement Learning - 설명 가능한 심층 강화 학습 연구 동향 및 방법론 - AI_블랙박스를_여는_기술은_양날의_검
2026-02-08
14 min
1st
(강화학습) Taxonomy and Trends in Reinforcement Learning for Robotics and Control Systems A Structured Review - 로봇 및 제어 시스템을 위한 강화 학습 분류와 트렌드 - 시뮬레이션_천재_로봇이_현실에서_바보가_되는_이유
(강화학습) Taxonomy and Trends in Reinforcement Learning for Robotics and Control Systems A Structured Review - 로봇 및 제어 시스템을 위한 강화 학습 분류와 트렌드 - 시뮬레이션_천재_로봇이_현실에서_바보가_되는_이유
2026-02-08
15 min
1st
(강화학습) Reinforcement Learning Meets Large Language Models A Survey of Advancements and Applications Across the LLM Lifecycle - 강화학습 기반 거대언어모델의 발전과 활용에 관한 서베이 - 스스로_정답_검증하며_진화하는_AI_추론
(강화학습) Reinforcement Learning Meets Large Language Models A Survey of Advancements and Applications Across the LLM Lifecycle - 강화학습 기반 거대언어모델의 발전과 활용에 관한 서베이 - 스스로_정답_검증하며_진화하는_AI_추론
2026-02-08
16 min
1st
(강화학습) Reward Models in Deep Reinforcement Learning A Survey - 심층 강화학습 보상 모델의 체계적 고찰과 전망 - AI의_욕망을_설계하는_보상_모델링
(강화학습) Reward Models in Deep Reinforcement Learning A Survey - 심층 강화학습 보상 모델의 체계적 고찰과 전망 - AI의_욕망을_설계하는_보상_모델링
2026-02-08
16 min
1st
(강화학습) A Technical Survey of Reinforcement Learning Techniques for Large Language Models - LLM의 정렬과 추론 강화를 위한 강화학습 기술 동향 - 정렬을_넘어_추론_엔진으로_진화한_강화학습
(강화학습) A Technical Survey of Reinforcement Learning Techniques for Large Language Models - LLM의 정렬과 추론 강화를 위한 강화학습 기술 동향 - 정렬을_넘어_추론_엔진으로_진화한_강화학습
2026-02-08
16 min
1st
(단단한 강화학습) 16 적용 및 사례 연구 - 강화학습의 혁신적 사례와 실전 적용 연구 -스승_없이_스스로_인간을_초월한_강화학습
(단단한 강화학습) 16 적용 및 사례 연구 - 강화학습의 혁신적 사례와 실전 적용 연구 -스승_없이_스스로_인간을_초월한_강화학습
2026-02-07
14 min
1st
(단단한 강화학습) 15 신경과학 - 강화학습과 신경과학 도파민과 보상 예측 오류 학습 - 뇌는_도파민의_예측_오차로_학습한다
(단단한 강화학습) 15 신경과학 - 강화학습과 신경과학 도파민과 보상 예측 오류 학습 - 뇌는_도파민의_예측_오차로_학습한다
2026-02-07
16 min
1st
(단단한 강화학습) 14 심리학 - 강화학습과 심리학 동물 학습의 계산적 이해 - AI와_뇌가_공유하는_예측과_습관의_알고리즘
(단단한 강화학습) 14 심리학 - 강화학습과 심리학 동물 학습의 계산적 이해 - AI와_뇌가_공유하는_예측과_습관의_알고리즘
2026-02-07
15 min
1st
(DRL) A Survey Analyzing Generalization inDeep Reinforcement Learning - 심층 강화학습의 일반화 기술 분석 및 통합 가이드라인 - 심층_강화학습이_낯선_환경에서_무너지는_이유
(DRL) A Survey Analyzing Generalization inDeep Reinforcement Learning - 심층 강화학습의 일반화 기술 분석 및 통합 가이드라인 - 심층_강화학습이_낯선_환경에서_무너지는_이유
2026-02-07
18 min
1st
(DRL) A Brief Survey of Deep Reinforcement Learning - 심층 강화 학습의 흐름과 핵심 기술 개관 - 아타리와_알파고를_정복한_심층_강화_학습의_비밀
(DRL) A Brief Survey of Deep Reinforcement Learning - 심층 강화 학습의 흐름과 핵심 기술 개관 - 아타리와_알파고를_정복한_심층_강화_학습의_비밀
2026-02-07
15 min
1st
(DRL) An Introduction to Deep Reinforcement Learning - 심층 강화학습의 핵심 원리와 알고리즘 체계 -차원의_저주를_깬_딥러닝과_강화_학습의_만남
(DRL) An Introduction to Deep Reinforcement Learning - 심층 강화학습의 핵심 원리와 알고리즘 체계 -차원의_저주를_깬_딥러닝과_강화_학습의_만남
2026-02-07
16 min
1st
(DRL) Deep Reinforcement Learning An Overview - 심층 강화학습 핵심 이론과 산업별 응용 기술의 전망 - 치명적인_삼중고_뚫고_진화한_딥_강화학습
(DRL) Deep Reinforcement Learning An Overview - 심층 강화학습 핵심 이론과 산업별 응용 기술의 전망 - 치명적인_삼중고_뚫고_진화한_딥_강화학습
2026-02-07
16 min
1st
(단단한 강화학습) 13 정책 경사도 방법 - 정책 경사도 방법의 원리와 알고리즘 요약 - AI가_계산_대신_직관과_전략을_배우는_법
(단단한 강화학습) 13 정책 경사도 방법 - 정책 경사도 방법의 원리와 알고리즘 요약 - AI가_계산_대신_직관과_전략을_배우는_법
2026-02-06
14 min
1st
(단단한 강화학습) 12 적격 흔적 - 적격 흔적 강화학습의 통합과 도약 - 강화학습의_똑똑한_단기_기억_적격_흔적
(단단한 강화학습) 12 적격 흔적 - 적격 흔적 강화학습의 통합과 도약 - 강화학습의_똑똑한_단기_기억_적격_흔적
2026-02-06
13 min
1st
(단단한 강화학습) 11 근사를 활용한 비활성 정책 방법 - 근사를 활용한 비활성 정책 강화학습 - AI_시스템을_붕괴시키는_죽음의_삼중고
(단단한 강화학습) 11 근사를 활용한 비활성 정책 방법 - 근사를 활용한 비활성 정책 강화학습 - AI_시스템을_붕괴시키는_죽음의_삼중고
2026-02-06
15 min
1st
(단단한 강화학습) 10 근사를 적용한 활성 정책 제어 - 근사법을 적용한 활성 정책 제어와 평균 보상 - 함수_근사_제어와_할인율의_무용성
(단단한 강화학습) 10 근사를 적용한 활성 정책 제어 - 근사법을 적용한 활성 정책 제어와 평균 보상 - 함수_근사_제어와_할인율의_무용성
2026-02-06
16 min
1st
(단단한 강화학습) 09 근사를 이용한 활성 정책 예측 - 근사를 활용한 활성 정책 예측 학습 - 차원의_저주를_깨는_함수_근사
(단단한 강화학습) 09 근사를 이용한 활성 정책 예측 - 근사를 활용한 활성 정책 예측 학습 - 차원의_저주를_깨는_함수_근사
2026-02-06
20 min
1st
(단단한 강화학습) 08 표에 기반한 방법을 이용한 계획 및 학습 - 강화학습의 통합 계획과 학습의 상호작용 - 계획과_학습을_하나로_잇는_다이나-큐
(단단한 강화학습) 08 표에 기반한 방법을 이용한 계획 및 학습 - 강화학습의 통합 계획과 학습의 상호작용 - 계획과_학습을_하나로_잇는_다이나-큐
2026-02-06
18 min
1st
(단단한 강화학습) 07 n단계 부트스트랩 - n단계 부트스트랩 TD와 몬테카를로의 통합 - 시간_단계의_족쇄를_끊는_n단계_부트스트래핑
(단단한 강화학습) 07 n단계 부트스트랩 - n단계 부트스트랩 TD와 몬테카를로의 통합 - 시간_단계의_족쇄를_끊는_n단계_부트스트래핑
2026-02-04
13 min
1st
(단단한 강화학습) 06 시간차 학습 - 강화학습의 핵심 시간차 학습의 원리와 제어 - 현실주의자_Sarsa와_이상주의자_Q-러닝
(단단한 강화학습) 06 시간차 학습 - 강화학습의 핵심 시간차 학습의 원리와 제어 - 현실주의자_Sarsa와_이상주의자_Q-러닝
2026-02-04
16 min
1st
(단단한 강화학습) 05 몬테카를로 방법 - 몬테카를로 강화학습 경험을 통한 가치 함수와 제어 학습 - 설명서_없이_경험만으로_게임을_정복하는_몬테카를로
(단단한 강화학습) 05 몬테카를로 방법 - 몬테카를로 강화학습 경험을 통한 가치 함수와 제어 학습 - 설명서_없이_경험만으로_게임을_정복하는_몬테카를로
2026-02-04
16 min
1st
(단단한 강화학습) 04 동적 프로그래밍 - 동적 프로그래밍과 마르코프 결정 과정의 최적화 - 동적_계획법이_만드는_완벽한_지도와_나침반
(단단한 강화학습) 04 동적 프로그래밍 - 동적 프로그래밍과 마르코프 결정 과정의 최적화 - 동적_계획법이_만드는_완벽한_지도와_나침반
2026-02-04
14 min
1st
(강화학습) A Survey of Reinforcement Learning Algorithms for Dynamically Varying Environments - 동적 변화 환경을 위한 강화학습 알고리즘 조사 및 분석 - 규칙이_변하는_현실_속_강화_학습의_생존법
(강화학습) A Survey of Reinforcement Learning Algorithms for Dynamically Varying Environments - 동적 변화 환경을 위한 강화학습 알고리즘 조사 및 분석 - 규칙이_변하는_현실_속_강화_학습의_생존법
2026-02-04
16 min
1st
(강화학습) Reinforcement Learning A Survey - 강화학습 기술과 전망에 관한 종합 보고서 - 보상과_시행착오로_스스로_정답_찾는_강화_학습
(강화학습) Reinforcement Learning A Survey - 강화학습 기술과 전망에 관한 종합 보고서 - 보상과_시행착오로_스스로_정답_찾는_강화_학습
2026-02-04
18 min
1st
(강화학습) A Comprehensive Survey of Reinforcement Learning From Algorithms to Practical Challenges - 강화학습 알고리즘의 범주별 분석과 응용 사례 조사 - 시행착오와_보상으로_최적의_전략을_찾는_강화학습
(강화학습) A Comprehensive Survey of Reinforcement Learning From Algorithms to Practical Challenges - 강화학습 알고리즘의 범주별 분석과 응용 사례 조사 - 시행착오와_보상으로_최적의_전략을_찾는_강화학습
2026-02-04
16 min
1st
(단단한 강화학습) 03 유한 마르코프 결정 과정 - 유한 마르코프 결정 과정의 기초와 수식적 정의 - MDP와_가치_함수로_최적의_전략_찾기
(단단한 강화학습) 03 유한 마르코프 결정 과정 - 유한 마르코프 결정 과정의 기초와 수식적 정의 - MDP와_가치_함수로_최적의_전략_찾기
2026-02-03
16 min
1st
(단단한 강화학습) 02 다중 선택 - 다중 선택과 탐색 k-중 암드 밴딧 문제의 이해 - 슬롯머신으로_푸는_탐험과_활용의_딜레마
(단단한 강화학습) 02 다중 선택 - 다중 선택과 탐색 k-중 암드 밴딧 문제의 이해 - 슬롯머신으로_푸는_탐험과_활용의_딜레마
2026-02-03
17 min
1st
(단단한 강화학습) 1. 소개 - 강화학습의 원리와 역사적 기초 - 정답_없이_시행착오와_보상으로_배우는_강화학습
(단단한 강화학습) 1. 소개 - 강화학습의 원리와 역사적 기초 - 정답_없이_시행착오와_보상으로_배우는_강화학습
2026-02-03
13 min
1st
IR 질의확장 - Query Expansion in the Age of Pre-trained and Large Language Models A Comprehensive Survey - 언어 모델 기반 질의 확장 기술의 진화와 전망 - 숨은_의도까지_찾아내는_LLM_쿼리_확장
IR 질의확장 - Query Expansion in the Age of Pre-trained and Large Language Models A Comprehensive Survey - 언어 모델 기반 질의 확장 기술의 진화와 전망 - 숨은_의도까지_찾아내는_LLM_쿼리_확장
2026-02-02
11 min
1st
IR 질의확장 - Query2doc Query Expansion with Large Language Models - Query2doc 거대 언어 모델을 활용한 쿼리 확장 검색 최적화 - AI_가상_문서로_검색_정확도_15__높이기
IR 질의확장 - Query2doc Query Expansion with Large Language Models - Query2doc 거대 언어 모델을 활용한 쿼리 확장 검색 최적화 - AI_가상_문서로_검색_정확도_15__높이기
2026-02-02
17 min
1st
IR 질의 확장 - A New Query Expansion Approach via Agent-Mediated Dialogic Inquiry - 소크라테스식 대화형 에이전트를 활용한 질의 확장 프레임워크 - 숨겨진_의도를_찾아내는_AI의_소크라테스식_자문자답
IR 질의 확장 - A New Query Expansion Approach via Agent-Mediated Dialogic Inquiry - 소크라테스식 대화형 에이전트를 활용한 질의 확장 프레임워크 - 숨겨진_의도를_찾아내는_AI의_소크라테스식_자문자답
2026-02-02
14 min
1st
검색기 판독기 - RAG+체인 - A Systematic Review of Key Retrieval-Augmented Generation (RAG) Systems Progress, Gaps, and Future Directions -검색 증강 생성의 진화와 산업별 실무 적용 지침 - AI_환각_막는_RAG의_오픈북_기술
검색기 판독기 - RAG+체인 - A Systematic Review of Key Retrieval-Augmented Generation (RAG) Systems Progress, Gaps, and Future Directions -검색 증강 생성의 진화와 산업별 실무 적용 지침 - AI_환각_막는_RAG의_오픈북_기술
2026-02-02
13 min
1st
검색기 판독기 - RAG확장 - A Survey on Retrieval-Augmented Text Generation for Large Language Models -거대언어모델의 검색 증강 생성 기술 프레임워크와 동향 연구 - AI_답변_뒤에_숨겨진_RAG의_정교한_엔지니어링
검색기 판독기 - RAG확장 - A Survey on Retrieval-Augmented Text Generation for Large Language Models -거대언어모델의 검색 증강 생성 기술 프레임워크와 동향 연구 - AI_답변_뒤에_숨겨진_RAG의_정교한_엔지니어링
2026-02-02
13 min
1st
검색기 판독기 - RAG - Retrieval-Augmented Generation for Large Language Models A Survey -검색 증강 생성의 진화 RAG 기술 및 패러다임 총괄 탐구 - 실시간_정보로_환각_잡는_RAG의_진화
검색기 판독기 - RAG - Retrieval-Augmented Generation for Large Language Models A Survey -검색 증강 생성의 진화 RAG 기술 및 패러다임 총괄 탐구 - 실시간_정보로_환각_잡는_RAG의_진화
2026-02-02
18 min
1st
검색기 판독기 - DPR - 밀집 구절 리트리버 오픈 도메인 질의응답의 혁신 -단어의_덫을_깨고_의미를_찾는_DPR
검색기 판독기 - DPR - 밀집 구절 리트리버 오픈 도메인 질의응답의 혁신 -단어의_덫을_깨고_의미를_찾는_DPR
2026-02-02
13 min
1st
11. LLMs are Also Effective Embedding Models An In-depth Overview - 거대언어모델의 임베딩 모델 활용 전략과 전망 - BERT를_밀어낸_LLM_임베딩의_두_전략
11. LLMs are Also Effective Embedding Models An In-depth Overview - 거대언어모델의 임베딩 모델 활용 전략과 전망 - BERT를_밀어낸_LLM_임베딩의_두_전략
2026-02-02
13 min
1st
11. Word Embeddings A Survey - 워드 임베딩 기술 및 전략에 관한 통합 서베이 - 왕에서_남자를_빼면_여왕이_나오는_이유
11. Word Embeddings A Survey - 워드 임베딩 기술 및 전략에 관한 통합 서베이 - 왕에서_남자를_빼면_여왕이_나오는_이유
2026-02-02
14 min
1st
11.4 임베딩모델 파인튜닝 - Sentence-BERT Sentence Embeddings using Siamese BERT-Networks - 샴_네트워크로_65시간을_5초로_줄인_SBERT
11.4 임베딩모델 파인튜닝 - Sentence-BERT Sentence Embeddings using Siamese BERT-Networks - 샴_네트워크로_65시간을_5초로_줄인_SBERT
2026-02-02
13 min
1st
10.4.2 도구 - Easytool Enhancing llm-based agents with concise tool instruction - AI_성능을_극대화하는_도구_설명서_정제법
10.4.2 도구 - Easytool Enhancing llm-based agents with concise tool instruction - AI_성능을_극대화하는_도구_설명서_정제법
2026-02-02
15 min
1st
11.8 A Comprehensive Survey on Vector Database Storage and Retrieval Technique, Challenge - AI에게_장기_기억을_심어주는_벡터_DB
11.8 A Comprehensive Survey on Vector Database Storage and Retrieval Technique, Challenge - AI에게_장기_기억을_심어주는_벡터_DB
2026-02-02
16 min
1st
11.8 벡터 데이터베이스 - Survey of Vector Database Management Systems - 벡터_DB_핵심_기술_HNSW와_시스템_선택
11.8 벡터 데이터베이스 - Survey of Vector Database Management Systems - 벡터_DB_핵심_기술_HNSW와_시스템_선택
2026-02-02
16 min
1st
13.1.1 LLM 캐스케이브 - Optimising Calls to Large Language Models with Uncertainty-Based Two-Tier Selection - 마진_샘플링으로_LLM_비용과_성능_동시_해결
13.1.1 LLM 캐스케이브 - Optimising Calls to Large Language Models with Uncertainty-Based Two-Tier Selection - 마진_샘플링으로_LLM_비용과_성능_동시_해결
2026-02-01
14 min
1st
13.1 다중 LLM 아키텍처 = LLM-Blender Ensembling Large Language Models with Pairwise Ranking and Generative Fusion - 여러_AI_섞어_최상의_답변_만드는_기술
13.1 다중 LLM 아키텍처 = LLM-Blender Ensembling Large Language Models with Pairwise Ranking and Generative Fusion - 여러_AI_섞어_최상의_답변_만드는_기술
2026-02-01
14 min
1st
12.10 RAG 대 파인튜닝 - Fine-Tuning or Retrieval Comparing Knowledge Injection in LLMs - 새로운_지식_주입은_미세조정보다_RAG가_압승
12.10 RAG 대 파인튜닝 - Fine-Tuning or Retrieval Comparing Knowledge Injection in LLMs - 새로운_지식_주입은_미세조정보다_RAG가_압승
2026-02-01
16 min
1st
12.8 RAG의 한계 - RECALL A Benchmark for LLMs Robustness against External Counterfactual Knowledge - 정답을_알고도_틀린_검색_결과에_굴복하는_AI
12.8 RAG의 한계 - RECALL A Benchmark for LLMs Robustness against External Counterfactual Knowledge - 정답을_알고도_틀린_검색_결과에_굴복하는_AI
2026-02-01
14 min
1st
12.6 RAG로 인컨텍스트 학습 예시 선택 - Learning to Retrieve In-Context Examples for Large Language Models - 스스로_최적의_학습_예시_찾는_LLM-R
12.6 RAG로 인컨텍스트 학습 예시 선택 - Learning to Retrieve In-Context Examples for Large Language Models - 스스로_최적의_학습_예시_찾는_LLM-R
2026-02-01
17 min
1st
12.4.6 RAG 파이프라인 - 생성 - Active Retrieval Augmented Generation - 글_쓰다_막히면_스스로_검색하는_AI
12.4.6 RAG 파이프라인 - 생성 - Active Retrieval Augmented Generation - 글_쓰다_막히면_스스로_검색하는_AI
2026-02-01
14 min
1st
12.4.5 RAG 파이프라인 - 삽입 - Lost in the Middle How Language Models Use Long Contexts - 정보가_많을수록_멍청해지는_LLM의_역설
12.4.5 RAG 파이프라인 - 삽입 - Lost in the Middle How Language Models Use Long Contexts - 정보가_많을수록_멍청해지는_LLM의_역설
2026-02-01
15 min
1st
12.4.4 RAG 파이프라인 - 정제 - Chain-of-Note Enhancing Robustness in Retrieval-Augmented Language Models - 스스로_팩트체크하는_AI의_메모_습관
12.4.4 RAG 파이프라인 - 정제 - Chain-of-Note Enhancing Robustness in Retrieval-Augmented Language Models - 스스로_팩트체크하는_AI의_메모_습관
2026-02-01
14 min
1st
12.4.4 RAG 파이프라인 - 정제 - RECOMP Improving Retrieval-Augmented LMs with Compression and Selective Augmentation - 문서_94_를_버려야_RAG가_똑똑해진다
12.4.4 RAG 파이프라인 - 정제 - RECOMP Improving Retrieval-Augmented LMs with Compression and Selective Augmentation - 문서_94_를_버려야_RAG가_똑똑해진다
2026-02-01
14 min
1st
12.4.3 RAG 파이프라인 - 리랭크 - RankZephyr Effective and Robust Zero-Shot Listwise Reranking is a Breeze! - GPT-4_이긴_70억_재순위_모델_랭크제퍼
12.4.3 RAG 파이프라인 - 리랭크 - RankZephyr Effective and Robust Zero-Shot Listwise Reranking is a Breeze! - GPT-4_이긴_70억_재순위_모델_랭크제퍼
2026-02-01
16 min
1st
12.4.3 RAG 파이프라인 - 리랭크 - RankVicuna Zero-Shot Listwise Document Reranking with Open-Source Large Language Models - GPT-4_성능_따라잡은_70억_오픈소스_랭크비쿠냐
12.4.3 RAG 파이프라인 - 리랭크 - RankVicuna Zero-Shot Listwise Document Reranking with Open-Source Large Language Models - GPT-4_성능_따라잡은_70억_오픈소스_랭크비쿠냐
2026-02-01
16 min
1st
12.4.3 RAG 파이프라인 - 리랭크 - Is ChatGPT Good at Search Investigating Large Language Models as Re-Ranking Agents - ChatGPT_검색_순위_능력을_흡수한_초소형_모델
12.4.3 RAG 파이프라인 - 리랭크 - Is ChatGPT Good at Search Investigating Large Language Models as Re-Ranking Agents - ChatGPT_검색_순위_능력을_흡수한_초소형_모델
2026-02-01
12 min
1st
12.4.3 RAG 파이프라인 - 리랭크 - Strategies for Effective and Efficient Text Ranking Using Large Language Models - 순위_매기기로_본_LLM의_치명적_약점
12.4.3 RAG 파이프라인 - 리랭크 - Strategies for Effective and Efficient Text Ranking Using Large Language Models - 순위_매기기로_본_LLM의_치명적_약점
2026-02-01
14 min
1st
12.4.3 RAG 파이프라인 - 리랭크 - Open-source Large Language Models are Strong Zero-shot Query Likelihood Models for Document Ranking - 문서_순위,_지시_튜닝은_오히려_독이_된다
12.4.3 RAG 파이프라인 - 리랭크 - Open-source Large Language Models are Strong Zero-shot Query Likelihood Models for Document Ranking - 문서_순위,_지시_튜닝은_오히려_독이_된다
2026-02-01
11 min
1st
12.4.3 RAG 파이프라인 - 리랭크 - ColBERT Efficient and Effective Passage Search via Contextualized Late Interaction over BERT - BERT보다_170배_빠른_검색_모델_ColBERT
12.4.3 RAG 파이프라인 - 리랭크 - ColBERT Efficient and Effective Passage Search via Contextualized Late Interaction over BERT - BERT보다_170배_빠른_검색_모델_ColBERT
2026-02-01
13 min
1st
12.4.2 RAG 파이프라인 - 검색 - A Multi-Task Embedder For Retrieval Augmented LLMs - 유사성_대신_유용성을_학습한_만능_검색기
12.4.2 RAG 파이프라인 - 검색 - A Multi-Task Embedder For Retrieval Augmented LLMs - 유사성_대신_유용성을_학습한_만능_검색기
2026-02-01
13 min
1st
12.4.2 RAG 파이프라인 - 검색 - Generative Retrieval with Few-shot Indexing - 훈련_필요_없는_퓨샷_생성형_검색
12.4.2 RAG 파이프라인 - 검색 - Generative Retrieval with Few-shot Indexing - 훈련_필요_없는_퓨샷_생성형_검색
2026-02-01
15 min
1st
12.4.2 RAG 파이프라인 - 검색 - Transformer Memory as a Differentiable Search Index - 문서를_암기해_검색_인덱스가_된_구글_DSI
12.4.2 RAG 파이프라인 - 검색 - Transformer Memory as a Differentiable Search Index - 문서를_암기해_검색_인덱스가_된_구글_DSI
2026-02-01
15 min
1st
12.4.2 RAG 파이프라인 - 검색 - How Does Generative Retrieval Scale to Millions of Passages - 생성적_검색_성능은_모델이_클수록_떨어졌다
12.4.2 RAG 파이프라인 - 검색 - How Does Generative Retrieval Scale to Millions of Passages - 생성적_검색_성능은_모델이_클수록_떨어졌다
2026-02-01
15 min
1st
12.4.1 RAG 파이프라인 - 재작성 - Can Query Expansion Improve Generalization of Strong Cross-Encoder Rankers - 검색어를_더할수록_AI가_멍청해지는_이유
12.4.1 RAG 파이프라인 - 재작성 - Can Query Expansion Improve Generalization of Strong Cross-Encoder Rankers - 검색어를_더할수록_AI가_멍청해지는_이유
2026-02-01
17 min
1st
12.4.1 Precise Zero-Shot Dense Retrieval without Relevance Labels - 가짜_답안을_지어내_진짜_정보를_찾는_HyDE
12.4.1 Precise Zero-Shot Dense Retrieval without Relevance Labels - 가짜_답안을_지어내_진짜_정보를_찾는_HyDE
2026-01-31
12 min
1st
12.4.1 Query2doc Query Expansion with Large Language Models - LLM_가상_문서로_애매한_검색어_확장하기
12.4.1 Query2doc Query Expansion with Large Language Models - LLM_가상_문서로_애매한_검색어_확장하기
2026-01-31
14 min
1st
12.3 When Not to Trust Language Models Investigating Effectiveness of Parametric and Non-Parametric Memories - 인기도_낮은_지식만_검색하는_AI_적응형_전략
12.3 When Not to Trust Language Models Investigating Effectiveness of Parametric and Non-Parametric Memories - 인기도_낮은_지식만_검색하는_AI_적응형_전략
2026-01-31
15 min
1st
12.1 Measuring Forgetting of Memorized Training Examples - AI의_기억을_지우는_범인은_무작위성
12.1 Measuring Forgetting of Memorized Training Examples - AI의_기억을_지우는_범인은_무작위성
2026-01-31
16 min
1st
12.1 Large Language Models Struggle to Learn Long-Tail Knowledge
12.1 Large Language Models Struggle to Learn Long-Tail Knowledge
2026-01-31
15 min
1st
11.9 Prism mapping interpretable concepts and features in a latent space of language
11.9 Prism mapping interpretable concepts and features in a latent space of language
2026-01-31
14 min
1st
11.9 An Intuitive Explanation of Sparse Autoencoders for LLM Interpretability
11.9 An Intuitive Explanation of Sparse Autoencoders for LLM Interpretability
2026-01-31
14 min
1st
11.6.1 2D Matryoshka Sentence Embddings
11.6.1 2D Matryoshka Sentence Embddings
2026-01-31
14 min
1st
11.5 MTEB Massive Text Embedding Benchmark
11.5 MTEB Massive Text Embedding Benchmark
2026-01-30
15 min
1st
11.5 Description-Based Text Similarity
11.5 Description-Based Text Similarity
2026-01-30
15 min
1st
11.4.3 Problems with Cosine as a Measure of Embedding Similarity for High Frequency Words
11.4.3 Problems with Cosine as a Measure of Embedding Similarity for High Frequency Words
2026-01-30
19 min
1st
11.4.2 NV-Retriever Improving text embedding models with effective hard-negative mining
11.4.2 NV-Retriever Improving text embedding models with effective hard-negative mining
2026-01-30
14 min
1st
10.4.6 AssistantBench Can Web Agents Solve Realistic and Time-Consuming Tasks
10.4.6 AssistantBench Can Web Agents Solve Realistic and Time-Consuming Tasks
2026-01-30
15 min
1st
10.4.6 The Dawn of GUI Agent A Preliminary Case Study with Claude 3.5 Computer Use
10.4.6 The Dawn of GUI Agent A Preliminary Case Study with Claude 3.5 Computer Use
2026-01-30
15 min
1st
10.4.4 Reflexion Language Agents with Verbal Reinforcement Learning
10.4.4 Reflexion Language Agents with Verbal Reinforcement Learning
2026-01-30
16 min
1st
10.4.4 On the Brittle Foundations of ReAct Prompting for Agentic Large Language Models
10.4.4 On the Brittle Foundations of ReAct Prompting for Agentic Large Language Models
2026-01-30
13 min
1st
10.4.2 ToolLLM Facilitating Large Language Models to Master 16000+ Real-world APIs
10.4.2 ToolLLM Facilitating Large Language Models to Master 16000+ Real-world APIs
2026-01-30
16 min
1st
10.4.1 Symbolic Planning and Code Generation for Grounded Dialogue
10.4.1 Symbolic Planning and Code Generation for Grounded Dialogue
2026-01-30
12 min
1st
9.2 추론 최적화 A Survey on Efficient Inference for Large Language Models
9.2 추론 최적화 A Survey on Efficient Inference for Large Language Models
2026-01-29
15 min
1st
8.8 추론 유도 SkunkworksAIreasoning-0.01
8.8 추론 유도 SkunkworksAI/reasoning-0.01
2026-01-29
16 min
1st
8.8 추론 유도 The Impact of Reasoning Step Length on Large Language Models
8.8 추론 유도 The Impact of Reasoning Step Length on Large Language Models
2026-01-29
12 min
1st
8.8 추론 유도 LLMs Can't Plan, But Can Help Planning in LLM-Modulo Frameworks
8.8 추론 유도 LLMs Can't Plan, But Can Help Planning in LLM-Modulo Frameworks
2026-01-29
15 min
1st
8.7 추론 Inductive or Deductive Rethinking the Fundamental Reasoning Abilities of LLMs
8.7 추론 Inductive or Deductive? Rethinking the Fundamental Reasoning Abilities of LLMs
2026-01-29
15 min
1st
8.7 추론 Faith and Fate Transformers as fuzzy pattern matchers
8.7 추론 Faith and Fate: Transformers as fuzzy pattern matchers
2026-01-29
15 min
1st
8.7 추론 Faith and Fate Limits of Transformers on Compositionality
8.7 추론 Faith and Fate: Limits of Transformers on Compositionality
2026-01-29
15 min
1st
8.7 추론 Natural Language Reasoning, A Survey
8.7 추론 Natural Language Reasoning, A Survey
2026-01-29
17 min
1st
8. A General Language Assistant as a Laboratory for Alignment
2
2026-01-29
14 min