Skip to main content

OpenAI CLIP 점수 탐색

이미지/캡션 데이터셋에서 OpenAI CLIP 점수 시각화 이 글은 AI 번역본입니다. 오역이 의심되면 댓글로 알려 주세요.
Created on September 12|Last edited on September 12
현재 사용 가능한 가장 큰 CLIP 모델을 사용해 CLIP 점수를 계산했습니다.
🤗 Hugging Face 구현을 사용합니다: clip-vit-large-patch14.
CLIP 점수 추론 방법은 모델 카드에서 확인하세요.

CLIP 점수 탐색

이 표는 대화형이며 이미지, 캡션, CLIP 점수를 포함합니다:
  • 정렬: 표는 CLIP 점수로 정렬되어 있습니다. 다른 값으로 정렬하려면 열을 클릭하세요.
  • 필터링: 사용자 정의 쿼리를 실행하려면 표의 왼쪽 상단을 클릭하세요(예: row["clip_score"] < 0.1)

img
caption
clip_score
1352
227
7956
4123
1005

내 데이터셋을 로깅하는 방법

표를 만들기 위해 실제로 이미지를 다운로드할 필요는 없으며, HTML 태그만 로깅해도 됩니다.
import pandas as pd
import wandb

df = pd.read_parquet('my_file.parquet')

# limit size for faster logging
df = df[:5000]

# log images as html instead of downloading them
def url_to_wandb_html(url):
return wandb.Html(f'<img src="{url}" alt="Not loading" style="max-height:100%; max-width:100%; height:auto; width:auto">')
df['img'] = df['url'].map(url_to_wandb_html)

# optional: reorder columns for good default viz (can customize it through UI)
ordered_keys = ['img', 'caption', *df.keys().drop(['img', 'caption'])]
df = df[ordered_keys]

# log
wandb.init(project='data_viz')
table = wandb.Table(dataframe=df)
wandb.log({'data': table})
wandb.finish()

이미지 데이터셋 도구

데이터셋을 다룰 때 추천하는 유용한 도구 몇 가지:
  • img2dataset: 이미지 데이터셋을 다운로드하기에 가장 편리한 도구(사용을 권장: webdataset 형식)
  • clip-retrieval: CLIP 임베딩과 함께 이미지/텍스트 데이터셋을 인덱싱하기 위한 도구 모음 FAISS CLIP 임베딩을 사용해 그 위에서 검색을 수행하기 위해

이 글은 AI가 번역한 기사입니다. 오역이 의심되는 부분이 있다면 댓글로 알려 주세요. 원문 보고서는 다음 링크에서 확인할 수 있습니다: 원문 보고서 보기
File<(table)>