2026-06-11 · 59편

Agentic AI

해당 날짜의 arXiv 발표에서 선별한 랭킹 브리프입니다. Cortiq은 주제 적합도, 주저자 맥락, 공개 연구 신호를 함께 봅니다.

1. A Lightweight Multi-Agent Framework for Automated Concrete Barrier Design

Wanting Wang, Xiye Ma, Yuyang He, Minghui Cheng, Ran Cao

주저자 소속 - Hunan University, China

2. IAPO: Input Attribution-Aware Policy Optimization for Tool Use in Small Multimodal Agents

Yifan Yang, Zhen Zhang, Jiayi Tian, Liyan Tan, Zheng Zhang

주저자 소속 - University of California, Santa Barbara

3. MODF-SIR: A Multi-agent Omni-modal Distilled Framework for Social Intelligence Reasoning

Shang Ma, Jisheng Dang, Wencan Zhang, Yifan Zhang, Bimei Wang, Hong Peng, Bin Hu, Qi Tian, Tat-Seng Chua

주저자 소속 - School of information Science and Engineering, Lanzhou University, Lanzhou, China

4. Agentic Environment Engineering for Large Language Models: A Survey of Environment Modeling, Synthesis, Evaluation, and Application

Jiachun Li, Zhuoran Jin, Tianyi Men, Yupu Hao, Kejian Zhu, ..., Jinshan Gao, Hongbang Yuan, Ruilin Xu, Kang Liu, Jun Zhao

주저자 소속 - Stanford University

5. Embodied-BenchClaw: An Autonomous Multi-Agent System for Embodied Spatial Intelligence Benchmark Construction

Baoyang Jiang, Fengchun Zhang, Leyuan Wang, Haotian Li, Yida Wang, Zhe Ji, Jinshan Lai, Xi Ren, Jianwei Hu, Qiang Ma

주저자 소속 - QiYuan Lab

6. MoCA-Agent: A Market-of-Claims Code Agent for Financial and Numerical Reasoning

Abdelrahman Abdallah, AbdelRahim A. Elmadany, Sameh Al Natour, Hasan Cavusoglu, Adam Jatowt, Muhammad Abdul-Mageed

주저자 소속 - University of Innsbruck

7. A Five-Plane Reference Architecture for Runtime Governance of Production AI Agents

주저자 소속 - Kami Waza. AI

8. Counterexample Guided Learning in the Large using Reasoning Agents

Hongyi Liu, Frederic Sala, Thomas Reps, Adithya Murali

주저자 소속 - Department of Computer Sciences, University of Wisconsin-Madison

9. NightFeats @ MMU-RAGent NeurIPS 2025: A Context-Optimized Multi-Agent RAG System for the Text-to-Text Track

Quentin Fever, Naziha Aslam

주저자 소속 - MMU-RAGent

10. Beyond Compaction: Structured Context Eviction for Long-Horizon Agents

Andrew Semenov, Svyatoslav Dorofeev

나머지 49편 보기

11. MedCTA: A Benchmark for Clinical Tool Agents

Tajamul Ashraf, Hyewon Jeong, Fida Mohammad Thoker, Bernard Ghanem

주저자 소속 - King Abdullah University of Science and Technology (KAUST), Saudi Arabia

12. InternVideo3: Agentify Foundation Models with Multimodal Contextual Reasoning

Ziang Yan, Sheng Xia, Jiashuo Yu, Yue Wu, Tianxiang Jiang, ..., Yinan He, Kai Chen, Limin Wang, Yu Qiao, Yi Wang

주저자 소속 - Shanghai AI Laboratory

13. FlowBank: Query-Adaptive Agentic Workflows Optimization through Precompute-and-Reuse

Lingzhi Yuan, Chenghao Deng, Fangxu Yu, Souradip Chakraborty, Mohammad Rostami, Furong Huang

주저자 소속 - University of Maryland, College Park

14. APPO: Agentic Procedural Policy Optimization

Xucong Wang, Ziyu Ma, Yong Wang, Yuxiang Ji, Shidong Yang, Guanhua Chen, Pengkun Wang, Xiangxiang Chu

주저자 소속 - University of Science and Technology of China

15. Can Open-Source LLM Agents Replace Static Application Security Testing Tools? An Empirical Assessment

Derek Yohn, Luke Flancher, Mirajul Islam, Khaled Slhoub

주저자 소속 - Florida Institute of Technology

16. The Periodic Table of LLM Reasoning: A Structured Survey of Reasoning Paradigms, Methods, and Failure Modes

Avinash Anand, Mahisha Ramesh, Avni Mittal, Ashutosh Kumar, Erik Cambria, Zhengkui Wang, Timothy Liu, Aik Beng Ng, Simon See, Rajiv Ratn Shah

주저자 소속 - SIT x Nvidia AI Center (SNAIC)

17. WorldReasoner: Evaluating Whether Language Model Agents Forecast Events with Valid Reasoning

Yizhou Chi, Eric Chamoun, Zifeng Ding, Andreas Vlachos

주저자 소속 - University of Cambridge

18. OCELOT: Inference-Leakage Budgets for Privacy-Preserving LLM Agents

Jin Xie, Songze Li

주저자 소속 - Stanford University

19. Automated Creativity Evaluation of Language Models Across Open-Ended Tasks

Min Sen Tan, Zachary Kit Chun Choy, Syed Ali Redha Alsagoff, Nadya Yuki Wangsajaya, Mohor Banerjee, Swaagat Bikash Saikia, Alvin Chan

주저자 소속 - Nanyang Technological University

20. Calibration Drift Under Reasoning: How Chain-of-Thought Budgets Induce Overconfidence in Large Language Models

Prakul Sunil Hiremath, Harshit R. Hiremath

주저자 소속 - Carnegie Mellon University

21. Measuring Epistemic Resilience of LLMs Under Misleading Medical Context

Hongjian Zhou, Xinyu Zou, Jinge Wu, Sean Wu, Junchi Yu, ..., Mingde Zeng, Lei Clifton, Linda Shapiro, Fenglin Liu, David A. Clifton

주저자 소속 - University of Oxford

22. SG2Loc: Sequential Visual Localization on 3D Scene Graphs

Nicole Damblon, Olga Vysotska, Federico Tombari, Marc Pollefeys, Daniel Barath

주저자 소속 - ETH Zurich

23. From Content to Knowledge: Lightning Fast Long-Video Understanding with Neural Knowledge Representations

Yuchen Guan, Xiao Li, Zongyu Guo, Xiaoyi Zhang, Xiulian Peng, Chun Yuan, Yan Lu

주저자 소속 - Tsinghua Shenzhen International Graduate School, Tsinghua University, Shenzhen, China

24. INFRAMIND: Infrastructure-Aware Multi-Agent Orchestration

Ahasan Kabir, Jiaqi Xue, Mengxin Zheng, Qian Lou

주저자 소속 - University of Central Florida

25. Organize then Retrieve: Hierarchical Memory Navigation for Efficient Agents

Hao-Lun Hsu, Nikki Lijing Kuang, Boyi Liu, Zhewei Yao, Yuxiong He

주저자 소속 - Duke University

26. When More Documents Hurt RAG: Mitigating Vector Search Dilution with Domain-Scoped, Model-Agnostic Retrieval

Nabaraj Subedi, Ahmed Abdelaty, Shivanand Venkanna Sheshappanavar

주저자 소속 - University of Wyoming

27. Multi-Agent Reasoning with Adaptive Worker Allocation for Stance Detection

Meysam Sabbaghan, Arman Zareian Jahromi, Doina Caragea

주저자 소속 - Kansas State University

28. Sovereign Assurance Boundary: Certificate-Bound Admission for Agentic Infrastructure

Jun He, Deying Yu

주저자 소속 - OpenKedge.io

29. Which Models Are Our Models Built On? Auditing Invisible Dependencies in Modern LLMs

Sanjay Adhikesaven, Haoxiang Sun, Sewon Min

주저자 소속 - University of California, Berkeley

30. DIRECT: When and Where Should You Allocate Test-Time Compute in Embodied Planners?

Jadelynn Dao, Milan Ganai, Yasmina Abukhadra, Ajay Sridhar, Mozhgan Nasr Azadani, Katie Luo, Clark Barrett, Jiajun Wu, Chelsea Finn, Marco Pavone

주저자 소속 - Stanford University

31. HERO: Hindsight-Enhanced Reflection from Environment Observations for Agentic Self-Distillation

Haoran Liu, Yuwei Zhang, Xiyao Li, Bohan Lyu, Jingbo Shang

주저자 소속 - University of California, San Diego

32. Architecture-Aware Reinforcement Learning Makes Sliding-Window Attention Competitive in Math Reasoning

Kai Liu, Peijie Dong, Xinchen Xie, Jianfei Gao, Qipeng Guo, Xiaowen Chu, Shaoting Zhang, Kai Chen

주저자 소속 - Shanghai AI Laboratory

33. Breaking Entropy Bounds: Accelerating RL Training via MTP with Rejection Sampling

Yucheng Li, Huiqiang Jiang, Yang Xu, Jianxin Yang, Yi Zhang, ..., Bo Zheng, Fei Huang, Junyang Lin, Dayiheng Liu, Jingren Zhou

주저자 소속 - Qwen Team, Alibaba Inc.

34. Agent Skill Evaluation and Evolution: Frameworks and Benchmarks

Kexin Ding, Yang Zhou, Can Jin, Feng Tong, Mu Zhou, Dimitris N. Metaxas

주저자 소속 - Rutgers University

35. ISE: An Execution-Grounded Recipe for Multi-Turn OS-Agent Trajectories

Siyuan Luo, Nairong Zheng, Lin Zhou, Tiankuo Yao, Shengyou Yuan, Haojia Yu, Cong Pang, Jiapeng Luo, Lewei Lu

36. Layer-Isolated Evaluation: Gating the Deterministic Scaffold of a Production LLM Agent with a No-LLM, Regression-Locked Test Harness

Sawyer Zhang, Alexander Wang, Sophie Lei

주저자 소속 - Lumivate (Lumi)

37. Goal-Autopilot: A Verifiable Anti-Fabrication Firewall for Unattended Long-Horizon Agents

주저자 소속 - Youwang Deng's primary institutional affiliation is not provided in the given source text.

38. MPC-Patch-Bench: Security-Aware LLM Code Patch for Multi-Party Computation

Yukuan Zhang, Mengxin Zheng, Qian Lou

주저자 소속 - University of Central Florida

39. Runtime Skill Audit: Targeted Runtime Probing for Agent Skill Security

Tu Lan, Chaowei Xiao

주저자 소속 - Johns Hopkins University

40. SwarmSense-DNN: A Trustworthy and Decentralized Neural Framework for Proactive Anomaly Defense in Consumer IoT

Jing Yang, Vijay Govindarajan, Saad Arif, Xu Xu, Mohamed Kallel, Zaffar Ahmed Shaikh, Zhe Liu, Chunhong Yuan, Lip Yee Por

주저자 소속 - Center of Research for Cyber Security and Network, Faculty of Computer Science and Information Technology, Universiti Malaya, 50603 Kuala Lumpur, Malaysia

41. CORE-Bench: A Comprehensive Benchmark for Code Retrieval in the Era of Agentic Coding

Fuwei Zhang, Yanzhao Zhang, Mingxin Li, Dingkun Long, Lexiang Hu, Pengjun Xie, Zhao Zhang, Fuzhen Zhuang

주저자 소속 - Institute of Artificial Intelligence, Beihang University

42. MASK: Multi-Agent Semantic K-Scheduling for Risk-Sensitive 6G Robotics

Ahmet Gunhan Aydin, Elif Tugce Ceran

주저자 소속 - Middle East Technical University

43. Intelligent Automation for Embodied Benchmark Construction: Pipelines, Embodiments, Simulators, and Trends

Jinshan Lai, Jianwei Hu, Baoyang Jiang, Fengchun Zhang, Leyuan Wang, Haotian Li, Yida Wang, Tingxuan Huang, Xi Ren, Qiang Ma

주저자 소속 - University of Electronic Science and Technology of China

44. UniIntervene: Agentic Intervention for Efficient Real-World Reinforcement Learning

Haoyuan Deng, Yitong Gao, Yudong Lin, Haichao Liu, Zhenyu Wu, Ziwei Wang

주저자 소속 - Nanyang Technological University

45. TimeRouter: Efficient and Adaptive Routing of Time-Series Foundation Models

Kanghui Ning, Yushan Jiang, Kashif Rasul, Anderson Schneider, Yuriy Nevmyvaka, Dongjin Song

주저자 소속 - School of Computing, University of Connecticut, Storrs, USA

46. Fine-tuning Multi-modal LLMs with ART: Art-based Reinforcement Training

Michal Chudoba, Sergey Alyaev, Petra Galuscakova, Tomasz Wiktorski

주저자 소속 - University of Stavanger

47. Bootstrapped Monitoring: Leveraging Transparent Reasoning to Oversee Stronger AI Agents

Frank Xiao, Mary Phuong

주저자 소속 - California Institute of Technology

48. External Experience Serving in Production LLM Systems: A Deployment-Oriented Study of Quality-Cost Trade-offs

Lin Sun, Heming Zhang, Xiangzheng Zhang

주저자 소속 - Qiyuan Tech

49. ParseFixer: An Agentic Framework for Document Parsing via Selective Multimodal Correction

LeKai Yu, Hao Liu, Kun Wang, Zhiran Li, Ruping Cao, Fan Liu, Yupeng Hu

주저자 소속 - Shandong University

50. An Entropy-based Framework for Hybrid Coalitions in Game Theory. Part I: Human Arbitration

Salome A. Sepulveda-Fontaine, Jose M. Amigo

주저자 소속 - Salome A. Sepulveda-Fontaine

51. AVIS: Adaptive Test-Time Scaling for Vision-Language Models

Ahmadreza Jeddi, Minh Ngoc Le, Amirhossein Kazerouni, Hakki Can Karaimer, Hue Nguyen, ..., Michael Brudno, Alex Levinshtein, Konstantinos G. Derpanis, Babak Taati, Radek Grzeszczuk

주저자 소속 - University of Toronto

52. VICX: Generalizable Robot Manipulation via Video Generation and In-Context Operator Network

Song Chen, Linyan Xiang, Ying Zhou, Liu Yang

주저자 소속 - National University of Singapore

53. Generalization Hacking: Models Can Game Reinforcement Learning by Preventing Behavioral Generalization

Frank Xiao, Mary Phuong

주저자 소속 - California Institute of Technology

54. ProcessThinker: Enhancing Multi-modal Large Language Models Reasoning via Rollout-based Process Reward

Jingpei Wu, Xiao Han, Weixiang Shen, Boer Zhang, Zifeng Ding, Volker Tresp

주저자 소속 - LMU Munich

55. Decoding Multimodal Cues: Unveiling the Implicit Meaning Behind Hateful Videos

Junyu Lu, Deyi Ji, Liqun Liu, Xiaokun Zhang, Youlin Wu, ..., Huan Yu, Jie Jiang, Bo Xu, Liang Yang, Hongfei Lin

주저자 소속 - Dalian University of Technology

56. DeceptionX: Explainable Deception Detection with Multimodal Large Language Models

Jiayu Zhang, Shuo Ye, Jiajian Huang, Yawen Cui, Taorui Wang, Wei Xia, Zeheng Wang, Haowen Tang, Hui Ma, Zitong Yu

주저자 소속 - Great Bay University

57. UniReason-Med: A Shared Grounded Reasoning Interface for 2D-to-3D Transfer in Medical VQA

Mengzhuo Chen, Yan Shu, Chi Liu, Hongming Piao, Xidong Wang, Derek Li, Bryan Dai

주저자 소속 - IQuest Research

58. Benchmarking Large Language Models for Safety Data Extraction

Jonas Grill, Thomas Bayer, Sören Berlinger

주저자 소속 - SAP SE, Germany

59. Distortion-Resilient Robotic Imitation Learning for Autonomous Cable Routing

Hao Wang, Fu-Zhao Ou, Shiqi Wang, Zhaolin Wan, Xiaopeng Fan

주저자 소속 - School of Artificial Intelligence, Harbin Institute of Technology, Harbin, Heilongjiang 150001, China