본문 바로가기

Search-R1 : Training LLMs to Reason and Leverage Search Engines with Reinforcement Learning 논문1. 서론기존의 검색 보강 생성(RAG) 방식이나 도구 기반 학습은 복잡한 다중 턴 검색 상호작용을 처리하는 데 한계가 있으며, 대규모 감독 학습 데이터에 의존합니다. 반면, 추론 중 검색을 사용하는 LLM은 검색 엔진과의 최적 상호작용 방법을 학습하지 못합니다. 따라서, LLM이 실시간 검색을 통해 추론을 수행하는 능력을 강화 학습을 통해 학습하도록 하는 접근이 필요합니다.2. 방법론Search-R1은 LLM이 단계별 추론 중에 실시간 검색을 통해 정보를 검색하고 이를 기반으로 답을 생성하는 방식으로 학습합니다. 강화 학습을 통해 검색 쿼리 생성 및 검색 결과 활용 전략을 학습하며, 검색된 토큰을 마스킹하여 안정적인 훈련을 도모합니다. 보상 함수는 단순한 결과 기반으로 설계되어, 모델이 최종 답의 ..
from torch._six import container_abcs ModuleNotFoundError: No module named 'torch._six' 에러 messagefrom torch._six import container_abcs ModuleNotFoundError: No module named 'torch._six' 발생원인torch 버전 업데이트 해결 방안1. torch 버전 downgrade2. import lib 수정from torch._six import container_abcs위 부분을 아래와 같이 수정from collections import abc as container_abcs
Modify its 'disableApiTermination' instance attribute and try again. AWS 인스턴스 종료(삭제)가 정상 동작 되지 않을 때 위 error가 발생. 해결 방안인스턴스의 종료 방지 기능을 확인할 필요가 있음 1. 인스턴스 선택 및 작업 선택 2. 종료 방지 기능 변경 선택 3. 종료 방지 활성화 확인 및 설정
bbox Label 좌표 형식 COCO 형식좌상단 x, 좌상단 y, bounding box width, bounding box height(left_top_x, left_top_ y, w, h)YOLO 형식bounding box 중심점 x, bounding box 중심점 y, bounding box width, bounding box height(center_x, center_y, w, h)KITTI, VOC 형식좌상단 x, 좌상단 y, 우하단 x, 우하단 y(left_top_x, left_top_y, right_bottom_x, right_bottom_y)
Yolo 라이센스 출처 : https://medium.com/deelvin-machine-learning/the-evolution-of-the-yolo-neural-networks-family-from-v1-to-v7-48dd98702a3d The evolution of the YOLO neural networks family from v1 to v7.If you need a fast object detector, then the neural network models of the YOLO family are de facto a standard today.medium.com 추가로 Ultralytics 코드를 사용할 경우 Yolov3도 AGPL-3.0 라이센스가 적용
코드 재 사용에 관한 라이센스 MIT, Apache License 2.0, GNU General Public License v3.0 (GPL-3.0), GNU Affero General POublic License v3.0 (AGPL-3.0)는 널리 사용되는 오픈 소스 라이센스이다. 1. MIT사용 및 배포소프트웨어를 자유롭게 사용 O소프트웨어의 복제본을 무제한 배포 O소프트웨어 수정 O수정된 소프트웨어 배포 O조건원본 소프트웨어의 저작권 고지와 라이센스 정보를 모든 복제본에 포함수정된 소프트웨어에도 동일하게 적용원본 저작권 및 라이센스 고지를 포함하는 한 소프트웨어를 상업적으로 사용 가능제한사용에 대한 보증 X소프트웨어 사용으로 인한 문제나 손해에 대하여 저작권자가 책임을 지지 않는다.2. Apache License 2.0사용 및 ..
coco 데이터셋 license coco dataset에는 license가 명시되어 있다."licenses": [{"url": "http://creativecommons.org/licenses/by-nc-sa/2.0/","id": 1,"name": "Attribution-NonCommercial-ShareAlike License"},{"url": "http://creativecommons.org/licenses/by-nc/2.0/","id": 2,"name": "Attribution-NonCommercial License"},{"url": "http://creativecommons.org/licenses/by-nc-nd/2.0/","id": 3,"name": "Attribution-NonCommercial-NoDerivs License..
set.update() 여러 개의 값을 한꺼번에 추가(update)할 때는 다음과 같이 진행s1 = set([1,2,3])s1.update([4,5,6])s1{1,2,3,4,5,6}