paper_review
2 items카테고리: paper_review
Name
Date
Qwen2-VL: Enhancing Vision-Language Model's Perception of the World at Any Resolution 이미지 해상도에 따라 visual token 수를 동적으로 조절하는 Naive Dynamic Resolution과 텍스트·이미지·비디오 위치 정보를 함께 다루는 M-RoPE를 공부한 기록입니다.
2026-06-05
Tagged Span Annotation for Detecting Translation Errors in Reasoning LLMs Tagged Span Annotation for Detecting Translation Errors in Reasoning LLMs Review
2026-04-15