Spaces:

kimseonghyeonyeah
/

my-midjourney-api

Sleeping

성현 김 commited on May 7

Commit

ba5a5ec

1 Parent(s): 2b484ea

Set cache ENV vars in Dockerfile, removed cache_folder arg from HuggingFaceEmbeddings

Files changed (2) hide show

Dockerfile CHANGED Viewed

@@ -41,7 +41,12 @@ COPY ./chroma_db_data /app/chroma_db_data
 ENV JAVA_HOME=/usr/lib/jvm/java-17-openjdk-amd64
 # ENV PYTHONUNBUFFERED=1 # 로그 즉시 확인 등에 유용
 # ENV PROJECT_ROOT=/app
 # 7. 실행할 포트 설정
 EXPOSE 7860

 ENV JAVA_HOME=/usr/lib/jvm/java-17-openjdk-amd64
 # ENV PYTHONUNBUFFERED=1 # 로그 즉시 확인 등에 유용
 # ENV PROJECT_ROOT=/app
+# ... (ENV JAVA_HOME 이전 또는 이후)
+ENV HF_HOME=/app/cache/huggingface
+ENV HF_HUB_CACHE=/app/cache/huggingface/hub
+ENV TRANSFORMERS_CACHE=/app/cache/huggingface/transformers
+ENV SENTENCE_TRANSFORMERS_HOME=/app/cache/huggingface/sentence_transformers
+# (필요하다면 RUN mkdir -p /app/cache/huggingface 와 같이 폴더 생성 명령 추가)
 # 7. 실행할 포트 설정
 EXPOSE 7860

app/app.py CHANGED Viewed

@@ -120,11 +120,15 @@ def load_models_and_setup():
     print("\n⏳ 모델 로딩 시작...")
     start_load_time = time.time()
-    try:
-        embedding_model = HuggingFaceEmbeddings(model_name=EMBEDDING_MODEL_NAME, model_kwargs={'device': DEVICE})
-        print(f"✅ 임베딩 모델 로드 완료 ({EMBEDDING_MODEL_NAME})")
-    except Exception as e:
-        print(f"🚨🚨🚨 임베딩 모델 로딩 실패 (치명적): {e}"); raise # API 핵심 기능이므로 예외 발생
     try:
         trans_tokenizer = AutoTokenizer.from_pretrained(TRANSLATION_MODEL_NAME)
         trans_model = AutoModelForSeq2SeqLM.from_pretrained(TRANSLATION_MODEL_NAME).to(DEVICE)

     print("\n⏳ 모델 로딩 시작...")
     start_load_time = time.time()
+try:
+    embedding_model = HuggingFaceEmbeddings(
+        model_name=EMBEDDING_MODEL_NAME,
+        model_kwargs={'device': DEVICE}
+        # cache_folder="/app/cache/huggingface_embeddings" # <--- 이 줄은 일단 삭제 또는 주석 처리
+    )
+    print(f"✅ 임베딩 모델 로드 완료 ({EMBEDDING_MODEL_NAME})")
+except Exception as e:
+    print(f"🚨🚨🚨 임베딩 모델 로딩 실패 (치명적): {e}"); raise
     try:
         trans_tokenizer = AutoTokenizer.from_pretrained(TRANSLATION_MODEL_NAME)
         trans_model = AutoModelForSeq2SeqLM.from_pretrained(TRANSLATION_MODEL_NAME).to(DEVICE)