본문으로 건너뛰기

"Code Generation" 태그로 연결된 2개 게시물개의 게시물이 있습니다.

코드 생성 관련 논문들

모든 태그 보기

생성형 AI의 테스트케이스 이해 및 활용 능력

· 약 6분
김정인
경북대학교 컴퓨터학부 소프트웨어테스팅연구실 석사과정생
경북대학교 컴퓨터학부 소프트웨어테스팅연구실 담당교수

논문 정보

  • 제목 (Title): 생성형 AI의 테스트케이스 이해 및 활용 능력 (A Study on the Capability of Generative AI to Understand and Utilize Test Cases)
  • 저자 (Authors) 및 소속 (Affiliations): 김정인 (경북대학교 컴퓨터학부), 이우진 (경북대학교 컴퓨터학부)
  • 학회 또는 저널명 (Conference or Journal Name): Korea Computer Congress 2025 (추정)
  • 제출일 또는 발행일 (Submission or Publication Date): 2025년 8월 21일 (추정)
  • 키워드 (Keywords): 생성형 AI, LLM, 테스트케이스, 코드 생성, 경쟁 프로그래밍, GPT-4.1, Zero-Shot 프롬프팅
  • 초록 (Abstract): LLM의 코드 생성 능력은 주목받고 있으나, 생성된 코드의 정확성과 신뢰성은 여전히 중요한 과제이다. 개발자의 신뢰도 향상 기법으로 활용되는 테스트케이스(TC)가 LLM의 코드 생성 정확도를 높일 수 있는지 알아보기 위해, 본 논문에서는 GPT-4.1 모델이 Zero-Shot 프롬프팅으로 경쟁 프로그래밍 문제를 해결하는 과정에서 TC 정보가 미치는 영향과 모델의 TC 생성 및 이해 능력을 분석한다.
  • 주요 연구 내용 (Main Research Content/Methodology):
    • 대상 모델 및 과제: GPT-4.1을 대상으로 경쟁 프로그래밍(CP) 문제 해결 능력을 평가했다.
    • 데이터셋: 백준 온라인 저지(BOJ)의 6개 알고리즘 유형(백트래킹, 이분 탐색, 비트 연산, 그리디, 수학, 정렬)에 대해 난이도(쉬움, 보통, 어려움)별로 각 3문제씩, 총 54개 문제를 선정했다.
    • 실험 설계: Zero-Shot 프롬프팅을 사용하여 세 가지 조건으로 코드 생성 정확도를 비교했다: 1) 문제 정의만 제공, 2) 문제 정의와 TC 함께 제공, 3) 입출력 조건과 TC만 제공.
    • TC 이해도 분석: TC 제공의 효과가 미미한 원인을 파악하기 위해, GPT-4.1의 Edge Case TC 생성 능력과 주어진 TC의 유효성을 검증하는 능력을 별도로 실험했다.
  • 주요 결과 및 결론 (Key Findings and Conclusion):
    • 전반적 성능 저하: TC를 추가로 제공하는 것이 GPT-4.1의 코드 생성 정답률을 전반적으로 향상시키지 못했다 (문제 정의만 제공 시 71.2%, TC 추가 시 69.9%).
    • 난이도별 영향: 쉬운 문제에서는 조건 간 성능 차이가 미미했으나, 보통 또는 어려운 문제에서는 TC를 추가할 경우 오히려 정답률이 감소하는 경향이 나타났다.
    • TC 이해 능력의 한계: GPT-4.1은 Edge Case TC를 정확하게 생성하거나 제공된 TC의 유효성을 올바르게 검증하는 데 명확한 한계를 보였다.
    • 결론: 현재 GPT-4.1은 개발자처럼 TC를 통해 문제의 요구사항이나 잠재적 오류를 추론하는 단계에 이르지 못했으며, TC 정보가 오히려 혼란을 야기할 수 있음을 시사한다.
  • 기여점 (Contributions):
    • LLM 코드 생성 과정에 TC를 직접 제공하는 방식의 효과를 실험적으로 검증하고, TC 정보가 항상 긍정적인 영향을 미치지 않는다는 것을 실증적으로 보였다.
    • 단순 코드 생성 능력 평가를 넘어 LLM의 TC 자체에 대한 생성 및 이해 능력을 분석하여, 성능 변화의 근본적인 원인을 탐구했다.
    • 일반 사용자의 활용 환경과 유사한 Zero-Shot 프롬프팅 조건에서 실험하여, 별도의 엔지니어링 없이 TC를 활용할 때의 한계점을 명확히 제시했다.
  • DOI (Digital Object Identifier): 정보 없음

Exploring the Competency of ChatGPT in Solving Competitive Programming Challenges

· 약 4분
Institute of Information Technology, Noakhali Science and Technology University
Institute of Information Technology, Noakhali Science and Technology University
Institute of Information Technology, Noakhali Science and Technology University
Institute of Information Technology, Noakhali Science and Technology University

논문 정보

  • 저자 (Authors): Md. Eusha Kadir, Tasnim Rahman, Sourav Barman, Md. Al-Amin
  • 소속 (Affiliations): Institute of Information Technology, Noakhali Science and Technology University, Noakhali, Bangladesh
  • 교신 저자 (Corresponding Author):Tasnim Rahman (tasnim.iit@nstu.edu.bd)
  • 학술지 (Journal): International Journal of Advanced Trends in Computer Science and Engineering (IJATCSE)
  • 볼륨 (Volume) 및 호 (No.): Volume 13, No.1
  • ISSN: 2278-3091
  • DOI: https://doi.org/10.30534/ijatcse/2024/031312024
  • 접수일 (Received Date): 2023년 12월 20일
  • 채택일 (Accepted Date): 2024년 1월 21일
  • 발행일 (Published Date): 2024년 2월 06일