오픈소스 기반 LLM 모델들의 시스템 프롬프트를 가져와보았다 (Open-weight LLMs, 본문 참조)
오픈소스로 공개된 오픈 모델(Open-weight) 모델들을 파인튜닝하여 자체적으로 모델을 만드는 경우가 많습니다. 그러나 토대가 되는 모델에서 시스템 프롬프트 방어 조치 등이 미흡한 경우, 해당 모델을 기반으로 하는 모든 모델들에 공통적인 취약점이 생긴다는 느낌이 들었습니다. 실험을 통해 같은 프롬프트… https://news.hada.io/topic?id=21743