OpenAI CLIP 점수 탐색
이미지/캡션 데이터셋에서 OpenAI CLIP 점수 시각화
이 글은 AI 번역본입니다. 오역이 의심되면 댓글로 알려 주세요.
Created on September 12|Last edited on September 12
Comment
현재 사용 가능한 가장 큰 CLIP 모델을 사용해 CLIP 점수를 계산했습니다.
CLIP 점수 추론 방법은 모델 카드에서 확인하세요.
CLIP 점수 탐색
이 표는 대화형이며 이미지, 캡션, CLIP 점수를 포함합니다:
- 정렬: 표는 CLIP 점수로 정렬되어 있습니다. 다른 값으로 정렬하려면 열을 클릭하세요.
- 필터링: 사용자 정의 쿼리를 실행하려면 표의 왼쪽 상단을 클릭하세요(예: row["clip_score"] < 0.1)
내 데이터셋을 로깅하는 방법
표를 만들기 위해 실제로 이미지를 다운로드할 필요는 없으며, HTML 태그만 로깅해도 됩니다.
import pandas as pdimport wandbdf = pd.read_parquet('my_file.parquet')# limit size for faster loggingdf = df[:5000]# log images as html instead of downloading themdef url_to_wandb_html(url):return wandb.Html(f'<img src="{url}" alt="Not loading" style="max-height:100%; max-width:100%; height:auto; width:auto">')df['img'] = df['url'].map(url_to_wandb_html)# optional: reorder columns for good default viz (can customize it through UI)ordered_keys = ['img', 'caption', *df.keys().drop(['img', 'caption'])]df = df[ordered_keys]# logwandb.init(project='data_viz')table = wandb.Table(dataframe=df)wandb.log({'data': table})wandb.finish()
이미지 데이터셋 도구
데이터셋을 다룰 때 추천하는 유용한 도구 몇 가지:
Add a comment