본문으로 건너뛰기

"Machine learning" 태그로 연결된 23개 게시물개의 게시물이 있습니다.

머신러닝 - 데이터로부터 패턴을 학습하여 예측과 의사결정을 수행하는 기술

모든 태그 보기

PAPER2CODE: AUTOMATING CODE GENERATION FROM SCIENTIFIC PAPERS IN MACHINE LEARNING

· 약 6분
Minju Seo
KAIST
Jinheon Baek
KAIST
Seongyun Lee
KAIST
Sung Ju Hwang
KAIST, DeepAuto.ai

논문 정보

  • 제목: PAPER2CODE: AUTOMATING CODE GENERATION FROM SCIENTIFIC PAPERS IN MACHINE LEARNING
  • 저자: Minju Seo (KAIST), Jinheon Baek (KAIST), Seongyun Lee (KAIST), Sung Ju Hwang (KAIST, DeepAuto.ai)
  • 학회/저널: arXiv (v4)
  • 발행일: 2025-10-10
  • DOI: (N/A)
  • 주요 연구 내용: 기계 학습(ML) 논문만 입력받아 완전한 코드 리포지토리를 생성하는 멀티 에이전트 LLM 프레임워크 'PaperCoder'를 제안함. PaperCoder는 1) Planning (계획), 2) Analysis (분석), 3) Generation (생성)의 3단계로 작업을 분해하여 인간 개발자의 워크플로우를 모방함.
  • 주요 결과 및 결론: PaperCoder는 자체 구축한 Paper2CodeBench 및 공개된 PaperBench 벤치마크에서 ChatDev, MetaGPT 등 기존 코드 생성 방식들을 큰 차이로 능가함. 생성된 코드는 원본 논문 저자의 평가에서도 88%가 최고로 선택되었으며, 92%가 재현에 도움이 된다고 응답함.
  • 기여점: ML 논문에서 코드 자동 생성을 위한 체계적인 3단계(계획-분석-생성) 멀티 에이전트 방법론을 제시함. 생성된 코드는 평균 0.81%의 코드 라인만 수정하면 실행 가능한 '거의 실행 가능한(near-executable)' 수준의 높은 품질을 달성하여 ML 연구의 재현성 위기를 해결하는 데 기여함.

A machine learning-integrated framework for mechanical property prediction of FDM-printed PLA

· 약 5분
Yassmin Seid Ahmed
Hany Hassanin
Aamer Nazir
Sikandar Khan

논문 정보

  • 제목: A machine learning-integrated framework for mechanical property prediction of FDM-printed PLA
  • 저자: Yassmin Seid Ahmed (King Fahd University of Petroleum & Minerals), Hany Hassanin (University of Birmingham), Aamer Nazir (King Fahd University of Petroleum & Minerals), Sikandar Khan (King Fahd University of Petroleum & Minerals)
  • 학회/저널: The International Journal of Advanced Manufacturing Technology
  • 발행일: 2025-08-08
  • DOI: 10.1007/s00170-025-16232-0
  • 주요 연구 내용: FDM(Fused Deposition Modeling)으로 제작된 PLA 부품의 극한 인장 강도(UTS)를 예측하기 위해 기계 학습(ML), 실험적 검증, 유한 요소 해석(FEA)을 통합한 프레임워크를 제안한다. 14개의 기존 연구에서 422개 샘플 데이터를 수집하여 10개의 ML 알고리즘을 평가하고, 예측 성능 향상을 위해 앙상블 모델을 개발했다.
  • 주요 결과 및 결론: 개별 ML 모델 중에서는 TabNet이 가장 높은 예측 정확도를 보였으며, 여러 모델을 결합한 앙상블 전략은 결정 계수(R2R^2) 99.09%라는 월등한 성능을 달성했다. 309개의 외부 독립 샘플을 통한 검증에서 10% 미만의 예측 오차를 보여 모델의 일반화 능력을 확인했으며, 래스터 각도와 내부 채움 밀도가 인장 강도에 가장 큰 영향을 미치는 공정 변수임을 밝혔다.
  • 기여점: 대규모 데이터셋(422개 샘플)과 10개의 다양한 ML 알고리즘, 앙상블 모델링을 적용하고, 외부 데이터셋, 실제 인장 실험, 물리 기반 FEA 시뮬레이션을 포함하는 다단계 검증 체계를 통해 기존 연구들의 한계를 극복했다. 이를 통해 적층 제조 부품의 기계적 물성을 예측하는 검증되고 확장 가능한 통합 솔루션을 제공한다.

Comparative Analysis of Explainable AI Methods for Manufacturing Defect Prediction: A Mathematical Perspective

· 약 5분
Gabriel Marín Díaz

논문 정보

  • 제목: Comparative Analysis of Explainable AI Methods for Manufacturing Defect Prediction: A Mathematical Perspective
  • 저자: Gabriel Marín Díaz (Faculty of Statistics, Complutense University & Science and Aerospace Department, Universidad Europea de Madrid)
  • 학회/저널: Mathematics
  • 발행일: 2025-07-29
  • DOI: 10.3390/math13152436
  • 주요 연구 내용: 기계 학습(XGBoost), 비지도 클러스터링(Fuzzy C-Means, K-means), 설명가능 AI(XAI)를 통합하여 제조 공정의 결함을 예측하고 분석하는 통합 프레임워크를 제안함. 지도 학습 모델로 결함 발생 가능성이 높은 시나리오를 분류하고, 비지도 학습으로 생산 데이터를 잠재적 운영 프로파일로 군집화하여 각 접근법을 XAI로 해석함.
  • 주요 결과 및 결론: XGBoost 모델은 95.37%의 높은 정확도로 결함을 예측했으며, SHAP, LIME 등의 XAI 기법은 'MaintenanceHours', 'DefectRate', 'QualityScore'를 핵심 영향 변수로 일관되게 식별함. K-means 클러스터링은 '고효율/고품질', '고위험/자원집약적', '균형/지속가능'의 세 가지 의미 있는 운영 프로파일을 성공적으로 분리했으나, Fuzzy C-Means는 명확한 군집 분리에 한계를 보임.
  • 기여점: 지도 학습, 비지도 클러스터링, XAI를 제조 결함 분석을 위한 단일 프레임워크로 통합한 최초의 연구임. 예측 모델링과 구조적 데이터 분석 모두에 XAI를 적용하여, 제조 공정의 동적 관계에 대한 투명하고 데이터 기반의 이해를 가능하게 하는 이중 해석 가능성 접근법을 제시함.

Prediction of Pick Acting Forces Using an Random Forest Model based on Mechanical Properties of Rocks and Cutting Parameters

· 약 6분
Mohammad Sharghi
국립부경대학교 에너지자원공학과 박사후연구원
Hoyoung Jeong
국립부경대학교 에너지자원공학과 조교수

논문 정보

  • 제목: Prediction of Pick Acting Forces Using an Random Forest Model based on Mechanical Properties of Rocks and Cutting Parameters
  • 저자: Mohammad Sharghi, Hoyoung Jeong (Pukyong National University)
  • 학회/저널: TUNNEL & UNDERGROUND SPACE
  • 발행일: 2025-02-24
  • DOI: https://doi.org/10.7474/TUS.2025.35.1.055
  • 주요 연구 내용: 195개의 암석 선형절삭시험 데이터세트를 구축하여 다변수 선형 회귀(MLR) 분석으로 기초 상관관계를 파악하고, 무작위 탐색 교차 검증(Randomized Search CV)으로 하이퍼파라미터를 튜닝한 최적화된 랜덤 포레스트(RF) 모델을 제안함. 이 모델을 사용하여 픽 커터의 평균 수직력(FNmFN_m)과 평균 절삭력(FCmFC_m)을 예측함.
  • 주요 결과 및 결론: 최적화된 RF 모델은 MLR 모델(FNmFN_m R2R^2=0.743, FCmFC_m R2R^2=0.674) 대비 매우 우수한 예측 성능을 보임. 테스트 데이터 기준, FNmFN_m 예측 R2R^2는 0.983, FCmFC_m 예측 R2R^2는 0.908을 달성함. 특징 중요도 분석 결과, FNmFN_m은 일축압축강도(UCS)가 지배적 영향을 미쳤으나, FCmFC_m은 여러 매개변수가 복합적으로 작용하는 것으로 나타남.
  • 기여점: 다양한 암종과 절삭 조건을 포함하는 포괄적인 데이터셋을 활용하여, 픽 커터 작용력 예측에 최적화된 RF 머신러닝 모델을 제시함. 특히 FNmFN_mFCmFC_m에 영향을 미치는 주요 인자(UCS 등)를 규명함으로써 굴착 효율성 및 공구 마모 예측의 정확도를 크게 향상시킴.

AI-Assisted Discovery of Biodegradable Polymer Alternatives

· 약 7분
Peter Broklyn
Sabir K

논문 정보

  • 제목: AI-Assisted Discovery of Biodegradable Polymer Alternatives
  • 저자: Peter Broklyn, Sabir K
  • 학회/저널: Polymer Recycling
  • 발행일: 2024년 12월
  • DOI: -
  • 주요 연구 내용: 인공지능(AI)을 활용하여 생분해성 고분자 대체재를 발견하는 방법론과 기술을 탐색하는 연구임. 기존의 시간과 비용이 많이 소모되는 시행착오 기반의 접근법 대신, AI를 통해 물질의 특성을 예측하고, 고분자 제형을 최적화하며, 새로운 대체재를 식별하는 과정을 가속화하는 역할을 강조함.
  • 주요 결과 및 결론: 머신러닝을 이용해 고분자의 물성을 예측하고, 생성 모델을 활용해 새로운 고분자 구조를 설계하며, 데이터 마이닝과 고속 스크리닝을 통해 유망한 후보를 식별할 수 있음을 보여줌. 이러한 AI 기술은 생분해성 폴리에스터 및 고분자 혼합물의 개발 사례에서 그 유용성이 입증됨.
  • 기여점: 기존의 고분자 연구 개발의 한계를 극복하기 위해 AI의 잠재력을 제시함. 특히, 분자 구조와 물성 간의 관계를 밝혀내고, 새로운 물질을 제안하며, 실험 과정을 간소화하는 데 AI가 핵심적인 역할을 할 수 있음을 보여줌으로써 지속 가능한 소재 개발의 새로운 방향을 제시함.

Material Property Prediction with Element Attribute Knowledge Graphs and Multimodal Representation Learning

· 약 5분
Chao Huang
Chunyan Chen
Ling Shil
Chen Chen

논문 정보

  • 제목: Material Property Prediction with Element Attribute Knowledge Graphs and Multimodal Representation Learning
  • 저자: Chao Huang (Institute of Computing Technology, Chinese Academy of Science; Ningbo Institute of Information Technology Application, Chinese Academy of Sciences), Chunyan Chen (Institute of Computing Technology, Chinese Academy of Science), Ling Shil (Institute of Computing Technology, Chinese Academy of Science), Chen Chen (Ningbo Institute of Information Technology Application, Chinese Academy of Sciences)
  • 학회/저널: arXiv
  • 발행일: 2024-11-13
  • DOI: 제공되지 않음
  • 주요 연구 내용: 기존 결정질 재료 물성 예측 모델들이 원소의 화학적, 물리적 특성을 간과하는 한계를 해결하고자 함. 원소의 속성(원자 반경, 전기음성도 등)을 체계화한 지식 그래프를 구축하고, 이를 임베딩하여 원소 속성 특징을 추출함. 이 특징을 결정 구조 그래프에서 추출한 특징과 결합하는 멀티모달 융합 프레임워크 'ESNet'을 제안함.
  • 주요 결과 및 결론: Materials Project 벤치마크 데이터셋을 이용한 실험에서, ESNet은 밴드갭 예측에서 기존 SOTA 모델들을 능가하는 성능(MAE 0.177 eV)을 달성했으며, 형성 에너지 예측에서는 대등한 결과를 보임. 이를 통해 구조적 정보에 화학적 사전 지식(원소 속성)을 통합하는 것이 물성 예측 정확도를 크게 향상시킬 수 있음을 입증함.
  • 기여점: 첫째, 재료 과학 분야에 활용 가능한 원소 속성 지식 그래프를 구축함. 둘째, 원소 속성 특징과 결정 구조 특징을 통합하는 새로운 멀티모달 융합 프레임워크 ESNet을 제안함. 셋째, 화학적 사전 지식의 통합이 재료 물성 예측, 특히 밴드갭 예측의 정확도를 크게 향상시킬 수 있음을 실험적으로 증명함.

A stacking ensemble model for predicting the flexural fatigue life of fiber-reinforced concrete

· 약 5분
Wan-lin Min
Wei-liang Jin
Yen-yi Hoo
Hailong Wang
Xiaoyu He
Yongke Wei
Jin Xia

논문 정보

  • 제목: A stacking ensemble model for predicting the flexural fatigue life of fiber-reinforced concrete
  • 저자: Wan-lin Min 외 (Zhejiang University)
  • 학회/저널: International Journal of Fatigue
  • 발행일: 2024-09-12
  • DOI: 10.1016/j.ijfatigue.2024.108599
  • 주요 연구 내용: 섬유 보강 콘크리트(FRC)의 휨 피로 수명을 예측하기 위해 스태킹 앙상블 기법에 기반한 새로운 모델(Stacking-SXDG)을 제안함. 이 모델은 Deep Autoencoder Network, XGBoost, Random Forest를 기본 학습기로 사용하고, Grey Wolf Optimizer(GWO) 알고리즘으로 최적화된 Deep Neural Network(DNN)를 메타 학습기로 활용하여 예측 정확도를 극대화함.
  • 주요 결과 및 결론: 제안된 Stacking-SXDG 모델은 테스트 데이터셋에서 R2R^{2} 값 0.938을 달성하여 다른 단일 머신러닝 모델들보다 월등한 예측 성능을 보임. SHAP 분석을 통해 응력 수준(stress level), 신뢰도(reliability), 섬유 종류 및 길이가 FRC의 피로 수명에 가장 큰 영향을 미치는 주요 인자임을 확인함.
  • 기여점: FRC의 휨 피로 수명 예측을 위해 머신러닝을 적용한 최초의 연구로, 단일 모델의 한계를 극복하는 강력한 스태킹 앙상블 프레임워크를 제시함. 또한, SHAP을 활용하여 모델의 예측 결과를 해석하고 각 입력 변수의 중요도를 정량적으로 분석하여 FRC 재료의 이해와 실제 적용 가능성을 높임.

Machine Learning Based Virtual Screening for Biodegradable Polyesters

· 약 4분
Navya Nori

논문 정보

  • 제목: Machine Learning Based Virtual Screening for Biodegradable Polyesters
  • 저자: Navya Nori (Milton High School)
  • 학회/저널: Journal of Materials Science and Chemical Engineering
  • 발행일: 2024-08-22
  • DOI: 10.4236/msce.2024.128001
  • 주요 연구 내용: 생성 모델(JTVAE)로 만든 수많은 폴리에스터 후보 분자들을 대상으로, 600개의 분자 실험 데이터로 학습된 Gradient Boosted Machine 모델을 사용하여 생분해성 점수를 예측함. 점수가 높은 분자들은 SynNet 모델을 통해 화학적 합성 가능성을 검증하여 최종 후보군을 선별하는 하이브리드 가상 스크리닝 프레임워크를 제안함.
  • 주요 결과 및 결론: 개발된 생분해성 예측 모델은 테스트 데이터셋에서 84%의 AUROC와 87%의 AUPRC를 달성하여 높은 정확도를 보였음. 분자 구조 분석 결과, 짧은 탄소 골격, 에스터 결합, 적절한 소수성이 생분해성에 긍정적인 영향을 미치는 것으로 나타났으며, 최종 후보 분자들은 실험실에서 합성이 가능한 것으로 확인됨.
  • 기여점: 기존의 고비용, 저효율 스크리닝 방법을 대체할 수 있는 저렴하고 확장 가능한 기계 학습 기반 접근법을 제시함. 생화학적 복잡성을 효과적으로 포착하여 새로운 생분해성 폴리에스터 후보 물질을 신속하게 발굴하고, 그 설계 원리에 대한 해석 가능성을 높임.

Polymer design via SHAP and Bayesian machine learning optimizes pDNA and CRISPR ribonucleoprotein delivery

· 약 4분
Rishad J. Dalal
University of Minnesota 연구원

논문 정보

  • 제목: Polymer design via SHAP and Bayesian machine learning optimizes pDNA and CRISPR ribonucleoprotein delivery
  • 저자: Rishad J. Dalal (University of Minnesota), Felipe Oviedo (Nanite Inc., University of Minnesota), Michael C. Leyden (University of Minnesota), Theresa M. Reineke (University of Minnesota)
  • 학회/저널: Chemical Science
  • 발행일: 2024-04-22
  • DOI: 10.1039/d3sc06920f
  • 주요 연구 내용: 길이, 이원 조성, pKavpK_{av}, 소수성(clog P)을 체계적으로 변화시킨 폴리머 라이브러리를 합성함. SHAP(SHapley Additive exPlanations) 분석과 베이지안 최적화(BO) 머신러닝을 결합하여 plasmid DNA(pDNA) 및 CRISPR-Cas9 리보핵단백질(RNP) 전달을 위한 정량적 구조-특성 관계를 해석하고 최적의 제형을 예측함.
  • 주요 결과 및 결론: pDNA 전달에는 낮은 폴리머 pKapK_{a}와 높은 benzimidazole ethanethiol(BET) 비율이 유리한 반면, RNP 전달에는 더 긴 폴리머 길이와 captamine(Cap) 양이온이 더 효과적임을 발견함. 머신러닝으로 최적화된 상위 3개 폴리머는 생체 내(in vivo)에서 대조군보다 1.7배 향상된 유전자 발현을 보이며 20일 이상 안정적으로 유지됨.
  • 기여점: 핵산의 종류에 따라 최적의 전달체 설계 파라미터가 다르다는 것을 설명 가능한 머신러닝(SHAP)을 통해 처음으로 규명함. 합성, 특성 분석, 머신러닝을 결합한 파이프라인을 제시하여 차세대 핵산 약물 전달체 개발을 가속화할 수 있는 강력한 도구를 제공함.

Machine learning based prediction models for spilt tensile strength of fiber reinforced recycled aggregate concrete

· 약 6분
Wesam Salah Alaloul
University Teknologi PETRONAS 연구원
IBRAHIM YOUSSEF ALYOUSSEF

논문 정보

  • 제목: Machine learning based prediction models for spilt tensile strength of fiber reinforced recycled aggregate concrete

  • 저자: Mohammed Alarfaj, Hisham Jahangir Qureshi (King Faisal University), Muhammad Zubair Shahab (COMSATS University Islamabad), Muhammad Faisal Javedd (Ghulam Ishaq Khan Institute), Md Arifuzzaman, Yaser Gamil (Monash University Malaysia)

  • 학회/저널: Case Studies in Construction Materials

  • 발행일: 2024-01-05

  • DOI: 10.1016/j.cscm.2024.e02945

  • 주요 연구 내용: 섬유보강 재생골재 콘크리트(FRAC)의 쪼갬 인장강도(STS)를 예측하기 위해 심층 신경망, 베이즈 최적화 가우시안 과정 회귀, 유전자 발현 프로그래밍을 기반으로 총 5개의 모델(DNN1, DNN2, OGPR, GEP1, GEP2)을 개발. 10개의 입력 변수와 1개의 출력 변수로 구성된 257개의 데이터 포인트를 수집하여 모델 학습(80%) 및 테스트(20%)에 사용. 관련성 계수와 순열 특성 중요도를 이용한 민감도 분석 수행.

  • 주요 결과 및 결론: 3개의 은닉층을 가진 심층 신경망 모델인 DNN2가 테스트 단계에서 R2 값 0.94, MAE 0.187 MPa, RMSE 0.255 MPa를 기록하며 가장 우수한 예측 성능을 보임. 전반적인 성능은 DNN2, OGPR, DNN1, GEP2, GEP1 순으로 높게 나타났으며, DNN과 OGPR 모델이 GEP 모델보다 더 강력하고 효율적인 예측 능력을 보여줌. 시멘트 함량, 천연 굵은 골재, 재생골재 밀도, 고성능 감수제는 쪼갬 인장강도에 긍정적인 영향을 미치는 주요 요인으로 확인됨.

  • 기여점: 섬유보강 재생골재 콘크리트의 쪼갬 인장강도 예측을 위한 다양한 머신러닝 모델의 성능을 체계적으로 비교 분석하여 최적의 예측 모델을 제시. 지속가능한 건설 재료로서 재생골재 콘크리트의 활용 가능성을 높이는 데 기여. 민감도 분석을 통해 콘크리트 강도에 영향을 미치는 주요 요인들을 정량적으로 규명하여 향후 콘크리트 설계 및 제조에 실용적인 가이드라인 제공.