전체 글

코딩으로 4차 산업혁명에 대비하자
SQL

II. 쿼리 금기사항

1. SARG란?Search Argument, 검색인수라고 하며 Predicate(조건식)에서 검색 대상 및 범위를 제한할 수 있는 식으로 해당 열에 인덱스 사용 및 쿼리 최적화를 위한 필요 조건이다.쿼리 성능 최적화에 중요한 역할을 하며, 인덱스를 제대로 활용하게 해준다. 이러한 활용이 DB 검색 속도를 향상시킨다. 2. Non-SARG란?비검색인수라고 하며, SARG의 반대말로 검색을 제한하지 않는 식이다.인덱스 사용이나 쿼리 최적화의 방해요소이다. 1) 불필요한 열 참조아래와 같이 * 모든컬럼을 다 부르는것도 속도를 저해한다. SELECT * FROM dbo.Categories 아래 행의 결과는 50만건이 나오는데, 이 많은 데이터를 한꺼번에 처리하여 작성일자를 sorting까지 하게 된다면 많은 ..

SQL

I. 쿼리 성능 개선법

1. 실행계획에서 index 사용 여부 확인하기MS SQL에서 쿼리 > 실제 실행 계획 포함 클릭  실제 실행계획 포함 후, 아래 쿼리문 실행함.위의 Set statistics io on 문은 어느정도의 읽기 IO가 발생됐는지 알 수 있다. SET STATISTICS IO ON;SELECT s.SupplierID, p.ProductID, p.ProductName, p.UnitPrice FROM dbo.Suppliers AS s INNER JOIN dbo.Products AS p ON s.SupplierID = p.SupplierIDWHERE p.SupplierID = 2메시지 창을 보면 아래와 같이 나오는데, lab 논리적 읽기 숫자확인을 봐야한다.숫자는 쿼리에서 읽은 [data/index] page ..

논문 리뷰

Differentiation of glioblastoma from solitary brain metastasis using deep ensembles: Empirical estimation of uncertainty for clinical reliability[Computer Methods and Programs in Biomedicine,2023]

제목: 딥러닝 앙상블을 이용한 뇌전이 교모세포종 판별 : 임상 신뢰성을 위한 불확실성의 경험적 추정---Abstract Background and Objectives: 예측 불확실성 추정 및 해석 가능성을 제공하여, 교모세포종(GBM)과 단일 뇌 전이(SBM)를 구분할 수 있는 임상적으로 신뢰할 수 있는 딥 러닝 모델을 개발. Methods: 총 469명의 환자(GBM 300명, SBM 169명)를  훈련 데이터 셋에 등록함. DenseNet121을 기반으로 한 딥러닝 앙상블이 다중 매개변수 MRI를 사용하여 훈련되었다. 모델 성능은 외부 테스트 셋(GBM 101명, SBM 42명)에서 검증되었다. 각 입력에 대한 엔트로피 값이 불확실성 측정을 위해 평가되었고, 엔트로피 값에 따라 데이터셋이 높은 불확실..

논문 리뷰

Patient-Friendly Discharge Summaries in Korea Based on ChatGPT: Software Development and Validation [JKMS,2024]

제목: ChatGPT를 기반으로 한 한국의 환자 친화적 퇴원 요약: 소프트웨어 개발 및 검증ABSTRACTBackground: 환자 친화적인 언어로 작성된 퇴원 요약서는 환자의 이해도와 만족도를 높일 수 있지만, 직원의 업무 부담을 증가시킬 수 있음. LLM을 사용하여 환자 친화적인 퇴원 요약서를 생성하는 소프트웨어를 개발하고 검증함.Method: 심근경색 환자 50명과 일반 외과에서 치료받은 환자 50명을 포함하여 총 100개의 퇴원 요약 문서를 사용하여 소프트웨어를 개발하고 테스트함. 각 문서에 대해 세 가지 다른 프롬프트 방법(zero-shot, one-shot, few-shot)을 사용하여 세 개의 새로운 요약을 생성하고, 사실성, 포괄성, 사용성, 용이성 및 유창성에 대해 5점 리커트 척도로 평..

논문 리뷰

Contrastive learning of heart and lung sounds for label-efficient diagnosis

https://www.sciencedirect.com/science/article/pii/S2666389921002671Introduction데이터 라벨링은 머신러닝에서 비용이 많이 들고 시간이 소요되는 과정임.농업, 의료, 언어 번역과 같은 분야에서는 훈련된 전문가가 필요하여 이 문제가 더욱 심각해짐.Supervised learning model은 라벨이 있는 데이터에 의존하여 일반화하며, 대량의 라벨링된 데이터를 얻는 데 한계가 있음.Contrastive learning은 제한된 라벨 데이터 문제를 해결할 수 있는 잠재적 솔루션으로, 라벨이 없는 데이터를 사용해 데이터의 일반 표현을 학습함.대조 학습은 이미지, 비디오, 오디오 등 다양한 분야에서 효과적인 결과를 보여줌.긍정 쌍을 생성하는 방법 중 하..

논문 리뷰

Development of Clinically Validated Artificial Intelligence Model for Detecting ST-segment Elevation Myocardial Infarction[Annals of Emergency Medicine]

summary논문 주제: ST분절 상승 심근경색을 감지하기 위한 임상적으로 검증된 인공지능 모델 개발https://www.sciencedirect.com/science/article/abs/pii/S0196064424003275 methods- 데이터: 전향적 경피적 관상동맥 중재술 레지스트리의 심전도(ECG) 파형 데이터- 관상동맥 조영술 데이터를 기반으로 각 심전도에 대한 기준(STEMI OR NOT STEMI) 설정- 5개의 CNN 을 결합한 앙상블 모델 개발- 검증 수행 방법: 증상 기반 심전도 데이터,의사와의 비교, 외부 검증 results- 18,697개 중 1745(9.3%)가 STEMI - AI 모델 accuracy( 전체 테스트 결과 중에서 올바르게 진단된 경우의 비율  92.1%)se..

논문 리뷰

A Lightweight CNN Model for Detecting Respiratory Diseases from Lung Auscultation Sounds using EMD-CWT-based Hybrid Scalogram [IEEE JOURNAL OF BIOMEDICAL AND HEALTH INFORMATICS,2020]

티스토리 두 달만에 쓰다니 진짜 반성할게요최근에 다른 인공지능 동아리를 시작해서 medical AI 팀에 들어갔다. sound signal 분야는 처음인데, 이번 계기로 새로 알게되는 점이 많을 것 같다.논문 출처 : https://arxiv.org/pdf/2009.04402Abstract이 논문에서는 경량화된 컨볼루션 신경망(CNN) 아키텍처를 제안하여 폐 호흡의 hybrid scalogram features 기반 특징을 사용해 호흡기 질환을 분류한다.  hybrid scalogram features 이란 , empirical mode decomposition (EMD) 와  continuous wavelet transform (CWT)를 사용한다. 모르는 용어 탐색:Empirical Mode Deco..

코딩테스트

백준 2004번 파이썬 - 조합 0의 개수

https://www.acmicpc.net/problem/2004 문제 (𝑛𝑚)$n \choose m$의 끝자리 0$0$의 개수를 출력하는 프로그램을 작성하시오.입력첫째 줄에 정수 𝑛$n$, 𝑚$m$ (0≤𝑚≤𝑛≤2,000,000,000$0 \le m \le n \le 2,000,000,000$, 𝑛≠0$n \ne 0$)이 들어온다.출력첫째 줄에 (𝑛𝑚)$n \choose m$의 끝자리 0$0$의 개수를 출력한다.예제 입력 1 복사25 12예제 출력 1 복사2  처음 작성한 코드import sysinput = sys.stdin.readlinea,b = map(int,input().split())def factorial(n): if n ==0: return 1 else: re..