categories / paper_review

paper_review

2 items

카테고리: paper_review

Name

Date

Qwen2-VL: Enhancing Vision-Language Model's Perception of the World at Any Resolution 이미지 해상도에 따라 visual token 수를 동적으로 조절하는 Naive Dynamic Resolution과 텍스트·이미지·비디오 위치 정보를 함께 다루는 M-RoPE를 공부한 기록입니다.

Tagged Span Annotation for Detecting Translation Errors in Reasoning LLMs Tagged Span Annotation for Detecting Translation Errors in Reasoning LLMs Review