Revise write-up description and content details

Updated the description of the write-up and made minor content adjustments.
This commit is contained in:
Damhwee Ahn
2025-10-24 15:00:08 +09:00
committed by GitHub
parent 50d3c804f3
commit 11d14b1956

View File

@@ -1,11 +1,11 @@
--- ---
title: "화이트햇콘테스트 2025 pre writeup(forensics/ai)" title: "화이트햇콘테스트 2025 pre writeup(forensics/ai)"
description: "ctf" description: "withcon 2025 pre writeup"
date: "Oct 23 2025" date: "Oct 23 2025"
--- ---
## 1. Introduction ## 1. Introduction
본문서는 2025 WHITEHAT 예선에 참가한 팀 헤일메리의 문제별 write-up으로, **AI Sommelier**와 **Leakage Investigation** 두 문제를 다룬다. (다른 문제는 미작성) 본문서는 2025 WHITEHAT 예선에 참가한 팀 헤일메리의 문제별 write-up으로, **AI Sommelier**와 **Leakage Investigation** 두 문제를 다룬다. (다른 문제는 내가 안풀어서 언젠간 시간나면 적을듯)
## 2. AI Sommelier ## 2. AI Sommelier
@@ -157,7 +157,7 @@ if __name__ == "__main__":
단일 모델(LLaMA 3.2)만으로도 상위 10개 선별 전략이 안정적으로 동작했고, 서버 채점 결과 정확 판정을 받아 플래그를 획득했다. 단일 모델(LLaMA 3.2)만으로도 상위 10개 선별 전략이 안정적으로 동작했고, 서버 채점 결과 정확 판정을 받아 플래그를 획득했다.
### 2.5 Discussion ### 2.5 Discussion
정석 접근은 두 후보 모델을 모두 서빙하여 표본별 `logprobs`를 직접 비교하는 것이다. 그럼에도 LLaMA 3.2 단일 모델의 로그우도만으로도 충분한 신호를 확보할 수 있었다. 정석 접근은 두 후보 모델을 모두 서빙하여 표본별 `logprobs`를 직접 비교하는 것이다. 그럼에도 LLaMA 3.2 단일 모델의 로그우도만으로도 충분한 신호를 확보할 수 있었다. 솔직히 내가 푼 방식도 정석풀이같긴 하다. 다른사람들 보니까 뭔가 문장에 규칙이 있어서 좀더 쉽게 풀었다곤 한다.
### 2.6 Runtime Evidence ### 2.6 Runtime Evidence
다음은 실행 로그에서 핵심 부분만 발췌한 결과다(대표 샘플 + 최종 제출/응답). 다음은 실행 로그에서 핵심 부분만 발췌한 결과다(대표 샘플 + 최종 제출/응답).