Skip to main content

생성형 AI의 테스트케이스 이해 및 활용 능력

· 6 min read
김정인
경북대학교 컴퓨터학부 소프트웨어테스팅연구실 석사과정생
경북대학교 컴퓨터학부 소프트웨어테스팅연구실 담당교수

논문 정보

  • 제목 (Title): 생성형 AI의 테스트케이스 이해 및 활용 능력 (A Study on the Capability of Generative AI to Understand and Utilize Test Cases)
  • 저자 (Authors) 및 소속 (Affiliations): 김정인 (경북대학교 컴퓨터학부), 이우진 (경북대학교 컴퓨터학부)
  • 학회 또는 저널명 (Conference or Journal Name): Korea Computer Congress 2025 (추정)
  • 제출일 또는 발행일 (Submission or Publication Date): 2025년 8월 21일 (추정)
  • 키워드 (Keywords): 생성형 AI, LLM, 테스트케이스, 코드 생성, 경쟁 프로그래밍, GPT-4.1, Zero-Shot 프롬프팅
  • 초록 (Abstract): LLM의 코드 생성 능력은 주목받고 있으나, 생성된 코드의 정확성과 신뢰성은 여전히 중요한 과제이다. 개발자의 신뢰도 향상 기법으로 활용되는 테스트케이스(TC)가 LLM의 코드 생성 정확도를 높일 수 있는지 알아보기 위해, 본 논문에서는 GPT-4.1 모델이 Zero-Shot 프롬프팅으로 경쟁 프로그래밍 문제를 해결하는 과정에서 TC 정보가 미치는 영향과 모델의 TC 생성 및 이해 능력을 분석한다.
  • 주요 연구 내용 (Main Research Content/Methodology):
    • 대상 모델 및 과제: GPT-4.1을 대상으로 경쟁 프로그래밍(CP) 문제 해결 능력을 평가했다.
    • 데이터셋: 백준 온라인 저지(BOJ)의 6개 알고리즘 유형(백트래킹, 이분 탐색, 비트 연산, 그리디, 수학, 정렬)에 대해 난이도(쉬움, 보통, 어려움)별로 각 3문제씩, 총 54개 문제를 선정했다.
    • 실험 설계: Zero-Shot 프롬프팅을 사용하여 세 가지 조건으로 코드 생성 정확도를 비교했다: 1) 문제 정의만 제공, 2) 문제 정의와 TC 함께 제공, 3) 입출력 조건과 TC만 제공.
    • TC 이해도 분석: TC 제공의 효과가 미미한 원인을 파악하기 위해, GPT-4.1의 Edge Case TC 생성 능력과 주어진 TC의 유효성을 검증하는 능력을 별도로 실험했다.
  • 주요 결과 및 결론 (Key Findings and Conclusion):
    • 전반적 성능 저하: TC를 추가로 제공하는 것이 GPT-4.1의 코드 생성 정답률을 전반적으로 향상시키지 못했다 (문제 정의만 제공 시 71.2%, TC 추가 시 69.9%).
    • 난이도별 영향: 쉬운 문제에서는 조건 간 성능 차이가 미미했으나, 보통 또는 어려운 문제에서는 TC를 추가할 경우 오히려 정답률이 감소하는 경향이 나타났다.
    • TC 이해 능력의 한계: GPT-4.1은 Edge Case TC를 정확하게 생성하거나 제공된 TC의 유효성을 올바르게 검증하는 데 명확한 한계를 보였다.
    • 결론: 현재 GPT-4.1은 개발자처럼 TC를 통해 문제의 요구사항이나 잠재적 오류를 추론하는 단계에 이르지 못했으며, TC 정보가 오히려 혼란을 야기할 수 있음을 시사한다.
  • 기여점 (Contributions):
    • LLM 코드 생성 과정에 TC를 직접 제공하는 방식의 효과를 실험적으로 검증하고, TC 정보가 항상 긍정적인 영향을 미치지 않는다는 것을 실증적으로 보였다.
    • 단순 코드 생성 능력 평가를 넘어 LLM의 TC 자체에 대한 생성 및 이해 능력을 분석하여, 성능 변화의 근본적인 원인을 탐구했다.
    • 일반 사용자의 활용 환경과 유사한 Zero-Shot 프롬프팅 조건에서 실험하여, 별도의 엔지니어링 없이 TC를 활용할 때의 한계점을 명확히 제시했다.
  • DOI (Digital Object Identifier): 정보 없음

AI Adoption for Collaboration: Factors Influencing Inclusive Learning Adoption in Higher Education

· 7 min read
Education Technology, Faculty of Education, King Faisal University
Education Technology, Faculty of Education, King Faisal University
Education Technology, Faculty of Education, King Faisal University
Education Technology, Faculty of Education, King Faisal University
Education Technology, Faculty of Education, King Faisal University

논문 정보

  • 저자 (Authors): Ibrahim Youssef Alyoussef, Amr Mohammed Drwish, Fatimah Adel Albakheet, Rafdan Hassan Alhajhoj, Amal Ahmed Almousa
  • 소속 (Affiliations): Education Technology, Faculty of Education, King Faisal University, Al-Ahsa 31982, Saudi Arabia
  • 교신 저자 (Correspondence): Ibrahim Youssef Alyoussef (ialyoussef@kfu.edu.sa)
  • 학술지 (Journal): IEEE Access (게재 승인 상태, 정식 편집 전 저자 버전)
  • 게재 예정일 (Date of publication): 미정 (xxxx 00, 0000으로 표기됨)
  • DOI: 10.1109/ACCESS.2025.3567656 (게재 예정 DOI로 보임)

Beyond the Hype: A Comprehensive Review of Current Trends in Generative AI Research, Teaching Practices, and Tools

· 9 min read
Abilene Christian University
Aalto University
Nuremberg Tech
University of California San Diego
Temple University
University of California Berkeley
FernUniversität in Hagen
Virginia Tech
University of Illinois
LMU Munich
University of Toronto Mississauga
University of Toronto Mississauga
University of Toronto Mississauga
University of Toronto Mississauga

논문 정보

  • 저자 (Authors): James Prather, Juho Leinonen, Natalie Kiesler, Jamie Gorson Benario, Sam Lau, Stephen MacNeil, Narges Norouzi, Simone Opel, Vee Pettit, Leo Porter, Brent N. Reeves, Jaromir Savelka, David H. Smith IV, Sven Strickroth, Daniel Zingaro (*공동 리더 표기 있음)
  • 소속 (Affiliations): Abilene Christian University, Aalto University, Nuremberg Tech, Google, University of California San Diego, Temple University, University of California Berkeley, FernUniversität in Hagen, Virginia Tech, University of Illinois, LMU Munich, University of Toronto Mississauga 등 다수 대학 및 기업 연구자 포함.
  • 학회/발행처 (Conference/Publisher): 2024 Working Group Reports on Innovation and Technology in Computer Science Education (ITICSE-WGR 2024), ACM
  • 제출년월일 (Publication Date): 2024년 7월 8-10일 (행사일 기준)
  • DOI: https://doi.org/10.1145/3689187.3709614
  • 페이지 (Pages): 39페이지 (본문 300-338로 표기됨)
  • 라이선스 (License): Creative Commons Attribution International 4.0 License
  • 키워드 (Keywords): 생성형 AI(generative AI, GenAI), 거대 언어 모델(large language models), 인공지능(artificial intelligence), 교육학적 실제(pedagogical practices), 컴퓨팅 교육(teaching computing, computing education)
  • CCS 개념 (CCS Concepts): 사회 및 전문 주제 → 컴퓨팅 교육; 컴퓨팅 방법론 → 인공지능

차분 테스트를 이용한 내광성 등급 예측 모델 성능 향상

· 5 min read
경북대학교 컴퓨터학부 소프트웨어테스팅연구실 석사과정생
경북대학교 컴퓨터학부 소프트웨어테스팅연구실 박사
경북대학교 컴퓨터학부 소프트웨어테스팅연구실 박사과정생
경북대학교 컴퓨터학부 소프트웨어테스팅연구실 담당교수

논문 정보

  • 제목 (Title): 차분 테스트를 이용한 내광성 등급 예측 모델 성능 향상
  • 저자 (Authors) 및 소속 (Affiliations):
    • 이대규 (경북대학교 IT대학 컴퓨터학부)
    • 서강복 (경북대학교 IT대학 컴퓨터학부)
    • 김덕엽 (경북대학교 IT대학 컴퓨터학부)
    • 이우진 (경북대학교 IT대학 컴퓨터학부)
  • 학회 또는 저널명 (Conference or Journal Name): 2024 한국컴퓨터종합학술대회 (KCC 2024)
  • 제출일 또는 발행일 (Submission or Publication Date): 2024년 6월
  • 키워드 (Keywords): 차분 테스트, 내광성 등급, 예측 모델, 성능 향상, 섬유, 색상 변화, 머신러닝, 앙상블

TRINITY: A Fast Compressed Multi-attribute Data Store

· 6 min read

논문 정보

  • 저자 (Authors) 및 소속 (Affiliations): Ziming Mao (UC Berkeley), Kiran Srinivasan (NetApp), Anurag Khandelwal (Yale)
  • 학회 또는 저널명 (Conference or Journal Name): Nineteenth European Conference on Computer Systems (EuroSys '24)
  • 제출일 또는 발행일 (Submission or Publication Date): 2024년 4월 22일-25일
  • DOI (Digital Object Identifier): https://doi.org/10.1145/3627703.3650072

A Survey on Web Testing: On the Rise of AI and Applications in Industry

· 8 min read
University of Luxembourg
University of Luxembourg
University of Luxembourg
University of Luxembourg

논문 정보

  • 저자 (Authors): Iva Kertusha¹, Gebremariem Assres¹, Onur Duman², Andrea Arcuri¹
  • 소속 (Affiliations): ¹Kristiania University College, Norway; ²Glasgow Caledonian University, Glasgow, UK
  • 게재처 (Publication Venue): arXiv (cs.SE)
  • 제출일 (Submission Date): 2025년 3월 7일 (arXiv 등록일 기준, 논문 내용은 2014-2024년 검토)
  • arXiv ID: arXiv:2503.05378v1
  • 키워드 (Keywords): 웹 테스팅(web testing), GUI 테스팅(GUI testing), 프론트엔드(front-end), 설문 조사(survey), SBST(Search-Based Software Testing), AI(Artificial Intelligence), 퍼징(fuzzing)

Exploring the Competency of ChatGPT in Solving Competitive Programming Challenges

· 4 min read
Institute of Information Technology, Noakhali Science and Technology University
Institute of Information Technology, Noakhali Science and Technology University
Institute of Information Technology, Noakhali Science and Technology University
Institute of Information Technology, Noakhali Science and Technology University

논문 정보

  • 저자 (Authors): Md. Eusha Kadir, Tasnim Rahman, Sourav Barman, Md. Al-Amin
  • 소속 (Affiliations): Institute of Information Technology, Noakhali Science and Technology University, Noakhali, Bangladesh
  • 교신 저자 (Corresponding Author):Tasnim Rahman (tasnim.iit@nstu.edu.bd)
  • 학술지 (Journal): International Journal of Advanced Trends in Computer Science and Engineering (IJATCSE)
  • 볼륨 (Volume) 및 호 (No.): Volume 13, No.1
  • ISSN: 2278-3091
  • DOI: https://doi.org/10.30534/ijatcse/2024/031312024
  • 접수일 (Received Date): 2023년 12월 20일
  • 채택일 (Accepted Date): 2024년 1월 21일
  • 발행일 (Published Date): 2024년 2월 06일

Scaling Deep Learning for Materials Discovery

· 7 min read
Google DeepMind
Google DeepMind
Google DeepMind
Google DeepMind
Google Research
Google Research

논문 정보

  • 제목 (Title): Scaling deep learning for materials discovery

  • 저자 (Authors) 및 소속 (Affiliations):

    • Amil Merchant (Google DeepMind)
    • Simon Batzner (Google DeepMind)
    • Samuel S. Schoenholz (Google DeepMind)
    • Muratahan Aykol (Google Research)
    • Gowoon Cheon (Google Research)
    • Ekin Dogus Cubuk (Google DeepMind)
  • 학회 또는 저널명 (Conference or Journal Name): Nature, Volume 624

  • 제출일 또는 발행일 (Submission or Publication Date): 2023년 11월 29일 (온라인 게재)

The Future of Software Testing: A Review of Trends, Challenges, and Opportunities

· 6 min read
Full Stack QA Architect, Cognizant

논문 정보

  • 저자 (Author): Mrs. Elavarasi Kesavan
  • 소속 (Affiliation): Full Stack QA Architect, Cognizant
  • 학술지 (Journal): International Journal of Innovations In Science Engineering And Management (IJISEM)
  • 볼륨 (Volume) 및 호 (Issue): Volume 4, Issue 2
  • 발행 연월 (Publication Year/Month): 2025년 4월 (Published: 15.04.2025)
  • ISSN: 2583-7117
  • DOI: 10.69968/ijisem.2025v4i253-57
  • 페이지 (Pages): 53-58
  • 라이선스 (License): Creative Commons Attribution-Share Alike 4.0 International License

Transfer Learning with Self-Supervised Vision Transformer for Large-Scale Plant Identification

· 7 min read
전북대학교 전자공학부
전북대학교 전자공학부
전북대학교 전자공학부
목포대학교 컴퓨터공학과
농촌진흥청

논문 정보

  • 제목 (Title): Transfer Learning with Self-Supervised Vision Transformer for Large-Scale Plant Identification
  • 저자 (Authors) 및 소속 (Affiliations):
    • Mingle Xu, Yongchae Jeong, Dong Sun Park (전북대학교 전자공학부, 지능로봇코어연구소)
    • Sook Yoon (목포대학교 컴퓨터공학과)
    • Jaesu Lee (농촌진흥청)
  • 학회 또는 저널명 (Conference or Journal Name): CLEF 2022: Conference and Labs of the Evaluation Forum, CEUR Workshop Proceedings (CEUR-WS.org)
  • 제출일 또는 발행일 (Submission or Publication Date): 2022년 9월 5일