Spaces:

ginigen
/

Today

Running

App Files Files Community

ginipick commited on May 11

Commit

eae33c8

verified ·

1 Parent(s): b6f8c25

tone: switch from 중고등학생 style to friendly AI expert tone (정중한 평어체) for news/model/space prompts + fallback templates

Browse files

Files changed (1) hide show

app.py +70 -62

app.py CHANGED Viewed

@@ -831,7 +831,7 @@ HTML_TEMPLATE = """
         <h1>🤖 투데이 AI : 데일리 TOP 100 소식</h1>
         <p class="subtitle">
             매일 아침 전 세계 AI 생태계의 핵심 100가지를 한눈에 확인하세요.<br>
-            최신 뉴스·모델·서비스를 AI가 직접 분석해서 쉽게 설명해드립니다.
         </p>
         <div class="badges">
@@ -1464,36 +1464,41 @@ class LLMAnalyzer:
             return None
     def analyze_news_simple(self, title: str, content: str = "") -> Dict:
-        """뉴스 기사를 중고등학생 수준으로 분석 - LLM API 사용"""
         # LLM API가 사용 가능한 경우 실제 분석
         if self.api_available:
             try:
                 messages = [
                     {
                         "role": "system",
-                        "content": """당신은 중고등학생도 이해할 수 있게 AI 뉴스를 쉽게 설명하는 전문가입니다.
-한국어로 답변하며, 다음 형식의 JSON으로만 응답하세요:
 {
-    "summary": "뉴스 내용을 8-10문장으로 자세하고 구체적으로 설명 (수치, 사실, 배경 포함)",
-    "significance": "이 뉴스가 왜 중요한지 2-3문장으로 설명",
     "impact_level": "high 또는 medium 또는 low",
     "impact_text": "높음 또는 중간 또는 낮음",
-    "impact_description": "어떤 영향이 있을지 2-3문장으로 설명",
-    "action": "중고등학생이 할 수 있는 것을 2-3문장으로 제안"
 }
 반드시 위 형식의 JSON만 출력하세요."""
                     },
                     {
                         "role": "user",
-                        "content": f"""다음 AI 뉴스를 중고등학생이 이해할 수 있도록 분석해주세요:
 제목: {title}
-각 항목을 구체적이고 자세하게 작성하되, 중고등학생 수준에 맞춰 쉽게 설명해주세요.
-특히 summary는 8-10문장으로 충분히 상세하게 작성하세요."""
                     }
                 ]
@@ -1574,20 +1579,20 @@ GPU는 AI 모델 학습과 추론에 필수적인 하드웨어로, 수천 개의
             if keyword.lower() in title.lower():
                 return template
-        # 기본 분석 (중고등학생 수준)
         return {
-            "summary": f"""'{title}'는 최신 AI 기술 동향을 다루는 중요한 뉴스입니다.
-인공지능 분야는 매일 새로운 발전을 이루고 있으며, 이러한 기술 변화는 우리의 일상생활, 교육, 그리고 미래 직업 세계에 직접적인 영향을 미칠 것으로 예상됩니다.
-최근 AI 기술은 단순히 데이터를 처리하는 수준을 넘어, 창의적인 콘텐츠를 생성하고 복잡한 문제를 해결하는 단계로 진화하고 있습니다.
-특히 대규모 언어 모델(LLM)과 생성형 AI의 발전은 산업 전반에 걸쳐 혁신을 가져오고 있습니다.
-이러한 기술 변화는 새로운 일자리를 창출하는 동시에, 기존 직업의 성격을 변화시키고 있어 우리 모두가 주목해야 할 트렌드입니다.
-전문가들은 향후 5-10년 내에 AI가 거의 모든 산업 분야에 통합될 것으로 전망하고 있습니다.
-따라서 관련 기술의 원리를 이해하고, 사회적 파급효과를 함께 고민하는 것이 미래 세대에게 매우 중요한 역량이 될 것입니다.""",
-            "significance": "AI 기술의 발전은 단순한 기술 혁신을 넘어 사회, 경제, 윤리적 측면에서 다양한 논의를 불러일으키고 있습니다. 이러한 변화를 이해하고 대비하는 것이 미래 세대에게 중요한 역량입니다.",
             "impact_level": "medium",
             "impact_text": "중간",
-            "impact_description": "AI 기술의 발전은 교육, 취업, 산업 전반에 걸쳐 구조적 변화를 가져올 것이며, 이에 대한 이해와 준비가 필요합니다.",
-            "action": "AI 기술의 기본 원리를 학습하고, 관련 프로그래밍(Python 등)이나 데이터 과학 기초를 공부해보세요. 또한 AI 윤리와 사회적 영향에 대해서도 비판적으로 사고하는 습관을 기르세요."
         }
     def analyze_model(self, model_name: str, task: str, downloads: int) -> str:
@@ -1602,7 +1607,7 @@ GPU는 AI 모델 학습과 추론에 필수적인 하드웨어로, 수천 개의
                 messages = [
                     {
                         "role": "system",
-                        "content": "당신은 중고등학생도 이해할 수 있게 AI 모델을 쉽게 설명하는 전문가입니다. 한국어로 답변하세요."
                     },
                     {
                         "role": "user",
@@ -1610,12 +1615,12 @@ GPU는 AI 모델 학습과 추론에 필수적인 하드웨어로, 수천 개의
 {model_card}
-이 모델을 중고등학생이 이해할 수 있도록 3-4문장으로 쉽게 설명해주세요. 다음 내용을 포함하세요:
-1. 이 모델이 무엇을 하는지
-2. 어떤 특징이 있는지
-3. 누가 사용하면 좋은지
-답변은 반드시 3-4문장의 한국어로만 작성하세요."""
                     }
                 ]
@@ -1651,7 +1656,7 @@ GPU는 AI 모델 학습과 추론에 필수적인 하드웨어로, 수천 개의
         else:
             popularity = "어느 정도"
-        return f"이 모델은 {task_desc} AI예요. {popularity} 사람들이 다운로드해서 사용하고 있어요. {model_name.split('/')[-1]}라는 이름으로 유명해요!"
     def analyze_space(self, space_name: str, space_id: str, description: str) -> Dict:
         """허깅페이스 스페이스 분석 - app.py를 LLM으로 분석"""
@@ -1665,7 +1670,7 @@ GPU는 AI 모델 학습과 추론에 필수적인 하드웨어로, 수천 개의
                 messages = [
                     {
                         "role": "system",
-                        "content": "당신은 중고등학생도 이해할 수 있게 AI 애플리케이션을 쉽게 설명하는 전문가입니다. 한국어로 답변하세요."
                     },
                     {
                         "role": "user",
@@ -1673,12 +1678,12 @@ GPU는 AI 모델 학습과 추론에 필수적인 하드웨어로, 수천 개의
 {app_code}
-이 앱을 중고등학생이 이해할 수 있도록 3-4문장으로 쉽게 설명해주세요. 다음 내용을 포함하세요:
-1. 이 앱이 무엇을 하는지
-2. 어떤 기술을 사용하는지
-3. 어떻게 활용할 수 있는지
-답변은 반드시 3-4문장의 한국어로만 작성하세요."""
                     }
                 ]
@@ -1713,7 +1718,7 @@ GPU는 AI 모델 학습과 추론에 필수적인 하드웨어로, 수천 개의
         # 3. Fallback: 템플릿 기반 설명
         return {
-            "simple_explanation": f"{space_name}는 웹브라우저에서 바로 AI를 체험해볼 수 있는 곳이에요. 설치 없이도 사용할 수 있어서 편리해요! 마치 온라인 게임처럼 바로 접속해서 AI를 사용할 수 있답니다.",
             "tech_stack": ["Python", "Gradio", "Transformers", "PyTorch"]
         }
@@ -1973,39 +1978,42 @@ class AdvancedAIAnalyzer:
         return all_news
     def _fallback_model_analysis(self, model_info: Dict) -> str:
-        """LLM 호출 실패/지연 시 사용할 즉시 fallback 설명"""
         name = model_info['name'].split('/')[-1]
         task = model_info.get('task', 'N/A') or 'N/A'
         dl = model_info.get('downloads', 0)
         task_kr = {
-            'text-generation': '글을 자동으로 만들어주는',
-            'image-to-text': '사진을 보고 설명을 써주는',
-            'text-to-image': '글을 읽고 그림을 그려주는',
-            'image-text-to-text': '이미지와 글을 함께 이해하는 멀티모달',
-            'text-to-speech': '글을 음성으로 변환하는',
-            'automatic-speech-recognition': '음성을 글로 받아쓰는',
-            'translation': '다른 언어로 번역해주는',
-            'question-answering': '질문에 답해주는',
-            'summarization': '긴 글을 짧게 요약해주는',
-            'text-classification': '글을 분류해주는',
-            'feature-extraction': '의미 벡터를 추출하는',
-            'sentence-similarity': '문장 의미 유사도를 비교하는',
-            'fill-mask': '빈칸을 채워주는',
-            'any-to-any': '여러 modality 처리하는',
-        }.get(task, '특별한 기능을 하는')
-        if dl > 10_000_000: pop = '엄청나게 많은'
-        elif dl > 1_000_000: pop = '아주 많은'
-        elif dl > 100_000: pop = '많은'
-        elif dl > 10_000: pop = '꽤 많은'
-        else: pop = '어느 정도'
-        return f"이 모델은 {task_kr} AI예요. {pop} 사람들이 다운로드해서 사용하고 있어요. {name}라는 이름으로 유명해요!"
     def _fallback_space_analysis(self, space_info: Dict) -> Dict:
         name = space_info.get('name', 'Space')
         sdk = space_info.get('sdk', 'gradio') or 'gradio'
         tech = ['Python', sdk.capitalize() if sdk else 'Gradio']
         return {
-            'simple_explanation': f"{name}는 웹브라우저에서 바로 AI를 체험해볼 수 있는 곳이에요. 설치 없이도 사용할 수 있어서 편리해요!",
             'tech_stack': tech,
         }
@@ -2414,13 +2422,13 @@ if __name__ == '__main__':
 ╚════════════════════════════════════════════════════════════╝
 📌 매일 아침 전 세계 AI 생태계의 핵심 100가지를 한눈에!
-   최신 뉴스·모델·서비스를 AI가 직접 분석해서 쉽게 설명합니다.
 ✨ 주요 기능:
   • 💾 SQLite DB 영구 스토리지
   • 🌐 AI Times 실시간 뉴스 크롤링 (오늘+어제)
   • 🔥 Hacker News Top Stories (36시간 이내)
-  • 📰 뉴스 중고등학생 수준 LLM 분석
   • 🤗 허깅페이스 트렌딩 모델 TOP 30 (모델 카드 분석)
   • 🚀 허깅페이스 트렌딩 스페이스 TOP 30 (app.py 분석)
   • 🧠 Fireworks AI (Qwen3-235B) 실시간 LLM 분석

         <h1>🤖 투데이 AI : 데일리 TOP 100 소식</h1>
         <p class="subtitle">
             매일 아침 전 세계 AI 생태계의 핵심 100가지를 한눈에 확인하세요.<br>
+            최신 뉴스·모델·서비스를 AI 전문가가 분석하여 핵심을 명확하게 전달해드립니다.
         </p>
         <div class="badges">
             return None
     def analyze_news_simple(self, title: str, content: str = "") -> Dict:
+        """뉴스 기사 분석 — 친절한 AI 전문가 톤 (LLM API 사용)"""
         # LLM API가 사용 가능한 경우 실제 분석
         if self.api_available:
             try:
                 messages = [
                     {
                         "role": "system",
+                        "content": """당신은 친절한 AI 전문가입니다. AI 산업의 최신 뉴스를 핵심을 짚어 명확하고 차분하게 설명하되, 누구나 이해할 수 있도록 친근한 한국어 어조를 유지합니다.
+- 어조: 정중한 평어체 (~합니다 / ~입니다). "~예요", "~답니다", "~네요" 같은 구어체 어미는 피합니다.
+- 깊이: 기술적 핵심 + 시장·산업적 함의 + 일반 독자가 알아두면 좋은 맥락 균형
+- 가독성: 짧은 문장, 한 문장 한 메시지. 전문 용어가 나오면 1줄 풀이를 덧붙입니다.
+다음 JSON 형식으로만 응답하세요:
 {
+    "summary": "뉴스의 핵심을 8-10문장으로 정중하게 설명. 수치·사실·배경·기술 맥락 포함.",
+    "significance": "이 뉴스가 왜 중요한지 2-3문장. 산업적·기술적 의미 명시.",
     "impact_level": "high 또는 medium 또는 low",
     "impact_text": "높음 또는 중간 또는 낮음",
+    "impact_description": "예상되는 파급 효과를 2-3문장으로 설명",
+    "action": "독자가 취할 수 있는 학습·실천 행동을 2-3문장으로 제안 (어조: 정중·실용)"
 }
 반드시 위 형식의 JSON만 출력하세요."""
                     },
                     {
                         "role": "user",
+                        "content": f"""다음 AI 뉴스를 분석해주세요:
 제목: {title}
+각 항목을 구체적이고 자세하게 작성하되, 친절한 AI 전문가의 톤으로 명확하게 설명해주세요.
+특히 summary는 8-10문장으로 핵심·배경·기술 맥락을 함께 담아 작성하세요."""
                     }
                 ]
             if keyword.lower() in title.lower():
                 return template
+        # 기본 분석 (친절한 AI 전문가 톤)
         return {
+            "summary": f"""'{title}'는 최신 AI 기술 동향을 다루는 중요한 뉴스입니다.
+인공지능 분야는 매일 새로운 발전을 이루고 있으며, 이러한 기술 변화는 일상·교육·산업·직업 세계 전반에 직접적인 영향을 미치고 있습니다.
+최근 AI 기술은 단순한 데이터 처리를 넘어 창의적 콘텐츠 생성과 복합적 문제 해결로 진화하고 있습니다.
+특히 대규모 언어 모델(LLM)과 생성형 AI의 발전은 산업 구조 자체를 재편하고 있습니다.
+이러한 변화는 새로운 직무를 창출하는 동시에 기존 직업의 성격을 빠르게 바꾸고 있습니다.
+전문가들은 향후 5-10년 내 AI가 대부분의 산업 영역에 통합될 것으로 전망합니다.
+따라서 기술 원리에 대한 기본 이해와 사회·윤리적 함의에 대한 균형 잡힌 시각이 점점 더 중요해집니다.""",
+            "significance": "AI 기술의 발전은 단순한 기술 혁신을 넘어 사회·경제·윤리 전반에 걸친 변화를 만들어내고 있습니다. 그 흐름을 이해하고 준비하는 일이 개인과 조직 모두에게 중요한 역량으로 자리잡고 있습니다.",
             "impact_level": "medium",
             "impact_text": "중간",
+            "impact_description": "AI 기술의 발전은 교육·취업·산업 구조에 점진적 변화를 가져올 가능성이 높으며, 이에 대한 학습과 적응이 필요합니다.",
+            "action": "AI의 기본 원리(LLM, RAG, 에이전트 등)와 Python·데이터 과학 기초 학습을 권장합니다. 함께 AI 윤리·안전·사회적 영향에 대한 균형 잡힌 시각도 함께 갖추시면 더욱 좋습니다."
         }
     def analyze_model(self, model_name: str, task: str, downloads: int) -> str:
                 messages = [
                     {
                         "role": "system",
+                        "content": "당신은 친절한 AI 전문가입니다. AI 모델의 핵심을 정확하고 명확하게 설명하되, 누구나 이해할 수 있는 친근한 한국어 어조를 유지합니다. 정중한 평어체 (~합니다 / ~입니다)를 사용하고, '~예요', '~답니다' 같은 구어체 어미는 피합니다."
                     },
                     {
                         "role": "user",
 {model_card}
+이 모델을 친절한 AI 전문가의 톤으로 3-4문장으로 설명해주세요. 다음을 포함하세요:
+1. 이 모델이 어떤 작업(task)을 수행하는지 — 핵심 기능
+2. 기술적 특징·강점 — 아키텍처·파라미터 규모·차별점 (전문 용어는 1줄 풀이)
+3. 적합한 활용 사례 — 어떤 사용자/팀에게 어떤 상황에서 유용한지
+답변은 반드시 3-4문장의 한국어로만 작성하세요. 정중한 평어체."""
                     }
                 ]
         else:
             popularity = "어느 정도"
+        return f"이 모델은 {task_desc} AI 모델입니다. 누적 다운로드 {downloads:,}회를 기록하며 {popularity} 사용자에게 활용되고 있습니다. '{model_name.split('/')[-1]}'(이)라는 이름으로 공개되어 있으며, 위 작업이 필요한 프로젝트에서 후보로 검토할 만한 모델입니다."
     def analyze_space(self, space_name: str, space_id: str, description: str) -> Dict:
         """허깅페이스 스페이스 분석 - app.py를 LLM으로 분석"""
                 messages = [
                     {
                         "role": "system",
+                        "content": "당신은 친절한 AI 전문가입니다. AI 애플리케이션의 핵심 기능과 기술 스택을 정확하고 명확하게 설명하되, 누구나 이해할 수 있는 친근한 한국어 어조를 유지합니다. 정중한 평어체 (~합니다 / ~입니다)를 사용하고, '~예요', '~답니다' 같은 구어체 어미는 피합니다."
                     },
                     {
                         "role": "user",
 {app_code}
+이 앱을 친절한 AI 전문가의 톤으로 3-4문장으로 설명해주세요. 다음을 포함하세요:
+1. 이 앱의 핵심 기능 — 사용자가 무엇을 할 수 있는지
+2. 사용 기술 스택 — 어떤 모델·라이브러리·프레임워크를 활용하는지
+3. 적합한 활용 사례 — 어떤 상황에서 유용한지
+답변은 반드시 3-4문장의 한국어로만 작성하세요. 정중한 평어체."""
                     }
                 ]
         # 3. Fallback: 템플릿 기반 설명
         return {
+            "simple_explanation": f"'{space_name}'는 웹 브라우저에서 바로 실행할 수 있는 인터랙티브 AI 데모입니다. 별도 설치 없이 즉시 체험할 수 있으며, AI 모델의 기능을 직접 입력·출력해보며 확인할 수 있습니다.",
             "tech_stack": ["Python", "Gradio", "Transformers", "PyTorch"]
         }
         return all_news
     def _fallback_model_analysis(self, model_info: Dict) -> str:
+        """LLM 호출 실패/지연 시 사용할 즉시 fallback 설명 — 친절한 AI 전문가 톤"""
         name = model_info['name'].split('/')[-1]
         task = model_info.get('task', 'N/A') or 'N/A'
         dl = model_info.get('downloads', 0)
         task_kr = {
+            'text-generation': '텍스트를 자동 생성하는 언어 모델',
+            'image-to-text': '이미지를 분석하여 텍스트 설명을 생성하는 모델',
+            'text-to-image': '텍스트 프롬프트로부터 이미지를 생성하는 확산(diffusion) 모델',
+            'image-text-to-text': '이미지와 텍스트를 함께 처리하는 멀티모달 모델',
+            'text-to-speech': '텍스트를 자연스러운 음성으��� 변환하는 TTS 모델',
+            'automatic-speech-recognition': '음성을 텍스트로 변환하는 ASR 모델',
+            'translation': '언어 간 번역을 수행하는 모델',
+            'question-answering': '문서 기반 질의응답을 수행하는 모델',
+            'summarization': '긴 문서를 요약하는 모델',
+            'text-classification': '텍스트를 분류하는 모델',
+            'feature-extraction': '의미 벡터(임베딩)를 추출하는 모델',
+            'sentence-similarity': '문장 간 의미 유사도를 계산하는 모델',
+            'fill-mask': '마스킹된 토큰을 예측하는 모델',
+            'text-to-video': '텍스트 프롬프트로부터 동영상을 생성하는 모델',
+            'image-text-to-image': '이미지·텍스트 입력으로부터 이미지를 생성/편집하는 모델',
+            'any-to-any': '여러 modality 입출력을 지원하는 통합 모델',
+        }.get(task, '특정 작업에 특화된 AI 모델')
+        if dl > 10_000_000: pop = '광범위한 사용자층이'
+        elif dl > 1_000_000: pop = '많은 개발자가'
+        elif dl > 100_000: pop = '활발히'
+        elif dl > 10_000: pop = '관심 있는 사용자들이'
+        else: pop = '초기 사용자 중심으로'
+        return f"이 모델은 {task_kr}입니다. 누적 다운로드 {dl:,}회를 기록하며 {pop} 활용 중인 모델이며, 'FINAL-Bench 컬렉션' 외부 커뮤니티에서도 폭넓게 검증되고 있습니다. '{name}'(이)라는 이름으로 공개되어 있으며, 위 작업이 필요한 프로젝트에서 후보로 검토하기 적합합니다."
     def _fallback_space_analysis(self, space_info: Dict) -> Dict:
+        """LLM 실패 시 fallback — 친절한 AI 전문가 톤"""
         name = space_info.get('name', 'Space')
         sdk = space_info.get('sdk', 'gradio') or 'gradio'
         tech = ['Python', sdk.capitalize() if sdk else 'Gradio']
         return {
+            'simple_explanation': f"'{name}'은(는) 웹 브라우저에서 바로 실행되는 인터랙티브 AI 데모입니다. 별도 설치 없이 즉시 입력·출력을 시도하며 모델의 동작을 확인할 수 있고, {sdk.capitalize() if sdk else 'Gradio'} 기반으로 구축되어 있습니다.",
             'tech_stack': tech,
         }
 ╚════════════════════════════════════════════════════════════╝
 📌 매일 아침 전 세계 AI 생태계의 핵심 100가지를 한눈에!
+   최신 뉴스·모델·서비스를 AI 전문가가 분석하여 핵심을 명확하게 전달합니다.
 ✨ 주요 기능:
   • 💾 SQLite DB 영구 스토리지
   • 🌐 AI Times 실시간 뉴스 크롤링 (오늘+어제)
   • 🔥 Hacker News Top Stories (36시간 이내)
+  • 📰 친절한 AI 전문가 톤 LLM 뉴스 분석
   • 🤗 허깅페이스 트렌딩 모델 TOP 30 (모델 카드 분석)
   • 🚀 허깅페이스 트렌딩 스페이스 TOP 30 (app.py 분석)
   • 🧠 Fireworks AI (Qwen3-235B) 실시간 LLM 분석