Commit inicial - upload de todos os arquivos da pasta

2026-02-13 01:31:03 -03:00
commit e388183601
22 changed files with 1382 additions and 0 deletions
--- a/.env
+++ b/.env
@@ -0,0 +1,2 @@
+OPENAI_API_KEY=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
+GEMINI_API_KEY=AIzaSyBEtSE6SpdOYXc0p5b5aepdcRuu53jHaFA
--- a/.env.example
+++ b/.env.example
@@ -0,0 +1,2 @@
+OPENAI_API_KEY=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
+GEMINI_API_KEY=AIzaSyBEtSE6SpdOYXc0p5b5aepdcRuu53jHaFA
--- a/Campanha-LP-Civil-Otimizada.md
+++ b/Campanha-LP-Civil-Otimizada.md
@@ -0,0 +1,120 @@
+REGRAS OTIMIZADAS PARA GOOGLE ADS:
+
+1. PALAVRAS-CHAVE (Fundo de Funil): Gere 20 termos com alta intenção de contratação. Use [Exata] e "Frase". Limite os termos a no máximo 25 caracteres para viabilizar o uso nos títulos.
+2. NEGATIVAS: Gere 20 termos que filtrem estudantes, curiosos e buscas gratuitas (ex: pdf, curso, modelo, jurisprudência, tcc).
+3. TÍTULOS (Headlines): Gere 15 títulos (máx. 30 caracteres). Regra de Ouro: A palavra-chave da Regra 1 deve aparecer de forma INTEGRAL e IDENTICA no título. Se a keyword for longa, o título será apenas ela.
+4. DESCRIÇÕES: Gere 4 descrições (máx. 90 caracteres). Devem terminar obrigatoriamente com um ponto final ou exclamação. Inclua uma Proposta Única de Valor (UVP).
+5. EXTENSÕES (Sitelinks & Callouts): 
+   - 4 Sitelinks (Título 25ch / Desc 35ch).
+   - 6 Callouts (Frases de destaque, máx 25ch) focadas em autoridade e agilidade.
+6. POLÍTICAS EDITORIAIS: 
+   - Proibido: "Grátis" e sinônimos.
+   - Proibido: CAIXA ALTA em palavras inteiras (exceto siglas como SP, OAB).
+   - Proibido: Uso excessivo de pontuação (ex: !!!).
+
+RETORNO: Apenas o JSON estruturado.
+
+
+
+/////////////////////////
+{
+  "campanha_google_ads": {
+    "palavras_chave_fundo_de_funil": [
+      "[advogado divórcio online]",
+      "\"contratar advogado família\"",
+      "[advogado guarda filhos]",
+      "\"advogado pensão alimentícia\"",
+      "[advogado inventário SP]",
+      "\"advogado união estável\"",
+      "[dissolução união estável]",
+      "\"escritório direito civil\"",
+      "[advogado para inventário]",
+      "\"especialista em divórcio\"",
+      "[ação de pensão alimentícia]",
+      "\"advogado guarda de menores\"",
+      "[advogado partilha de bens]",
+      "\"consultoria jurídica família\"",
+      "[divórcio consensual online]",
+      "\"advogado civilista SP\"",
+      "[inventário extrajudicial]",
+      "\"advogado direito de família\"",
+      "[pedir pensão alimentícia]",
+      "\"advogado separação judicial\""
+    ],
+    "palavras_chave_negativas": [
+      "grátis (evitar buscas sem orçamento)",
+      "gratuito (evitar defensoria pública)",
+      "estágio (evitar candidatos a vaga)",
+      "vagas (evitar candidatos a vaga)",
+      "curso (evitar estudantes)",
+      "faculdade (evitar estudantes)",
+      "tcc (evitar estudantes)",
+      "modelo de petição (evitar curiosos)",
+      "jurisprudência (evitar estudantes)",
+      "pdf (evitar buscas informativas)",
+      "concurso (evitar concurseiros)",
+      "trabalhista (fora do escopo civil)",
+      "criminal (fora do escopo civil)",
+      "previdenciário (fora do escopo civil)",
+      "defensoria pública (baixa intenção)",
+      "fórum (busca informativa)",
+      "como fazer (busca informativa)",
+      "lei (busca informativa)",
+      "livro (evitar estudantes)",
+      "apostila (evitar estudantes)"
+    ],
+    "titulos_headlines": [
+      "Advogado divórcio online",
+      "Contratar advogado família",
+      "Advogado guarda filhos",
+      "Advogado pensão alimentícia",
+      "Advogado inventário SP",
+      "Advogado união estável",
+      "Dissolução união estável",
+      "Escritório direito civil",
+      "Advogado para inventário",
+      "Especialista em divórcio",
+      "Ação de pensão alimentícia",
+      "Advogado guarda de menores",
+      "Advogado partilha de bens",
+      "Consultoria jurídica família",
+      "Divórcio consensual online"
+    ],
+    "descricoes": [
+      "Advocacia especializada em Direito Civil e Família. Atendimento 100% online e sigiloso.",
+      "Resolva seu divórcio, guarda ou inventário de forma rápida e segura. Fale com um expert.",
+      "Proteja seus direitos e sua família com especialistas. Soluções ágeis e atendimento humanizado.",
+      "Mais de 10 anos de experiência em Direito de Família. Avalie seu caso com total sigilo."
+    ],
+    "sitelinks": [
+      {
+        "titulo": "Divórcio e Separação",
+        "desc_linha_1": "Encerre o caso de forma rápida.",
+        "desc_linha_2": "Consensual ou litigioso online."
+      },
+      {
+        "titulo": "Guarda e Pensão",
+        "desc_linha_1": "Priorizando o bem-estar dos filhos.",
+        "desc_linha_2": "Definição e revisão de valores."
+      },
+      {
+        "titulo": "Inventário e Herança",
+        "desc_linha_1": "Solução ágil na partilha de bens.",
+        "desc_linha_2": "Via judicial ou extrajudicial."
+      },
+      {
+        "titulo": "Fale com Especialista",
+        "desc_linha_1": "Atendimento rápido via WhatsApp.",
+        "desc_linha_2": "Tire suas dúvidas agora mesmo."
+      }
+    ],
+    "callouts": [
+      "Atendimento 100% Online",
+      "Sigilo Total Garantido",
+      "10 Anos de Experiência",
+      "Resposta Rápida",
+      "Especialista em Família",
+      "Solução Sem Burocracia"
+    ]
+  }
+}
--- a/13
+++ b/13
@@ -0,0 +1,13 @@
+FROM python:3.11-slim
+
+WORKDIR /app
+
+COPY requirements.txt .
+
+RUN pip install --no-cache-dir -r requirements.txt
+
+COPY . .
+
+EXPOSE 8501
+
+CMD ["streamlit", "run", "app.py", "--server.port=8501", "--server.address=0.0.0.0"]
--- a/Uteis.txt
+++ b/Uteis.txt
@@ -0,0 +1,5 @@
+# Como criar uma Campanha - adriano gianini
+https://www.youtube.com/watch?v=4HMDAhl15cA
+
+#Amanda Agostinho
+https://www.youtube.com/watch?v=XU1MWVk6HvQ
--- a/Prompt.md
+++ b/Prompt.md
@@ -0,0 +1,55 @@
+Objetivo: Landing Page (LP) já está bem otimizada para conversão, ela é a melhor fonte de "verdade" para o Google Ads. Usar Python para automatizar isso não só economiza tempo, mas garante que o anúncio seja um reflexo fiel do que o usuário vai encontrar na página (o que aumenta o seu **Índice de Qualidade**).
+
+Aqui está como eu estruturaria essa aplicação Python para você:
+
+---
+
+## 🛠️ Arquitetura da Aplicação
+
+Para construir isso "do zero", você pode dividir o script em quatro módulos principais:
+
+### 1. Scraping (Extração de Conteúdo)
+
+Use as bibliotecas `BeautifulSoup` ou `Selenium`.
+
+* **O que pegar:** Títulos (`h1`, `h2`), textos de benefícios, CTAs (chamadas para ação) e a meta-description.
+* **Dica:** Foque em extrair a **proposta de valor** central.
+
+### 2. Processamento com IA (O "Cérebro")
+
+Em vez de tentar criar lógica de palavras-chave na mão, conecte o Python à **API do OpenAI**
+
+* **Prompt de Ouro:** "Com base no texto desta LP [solicitar URL], gere: 10 variações de palavras-chave (fundo de funil), 3 títulos de 30 caracteres, 2 descrições de 90 caracteres e 4 sitelinks."
+
+### 3. Estruturação dos Ativos
+
+Organize os dados extraídos no formato que o Google Ads aceita (planilhas de upload em massa ou via API).
+
+* **Palavras-chave:** Classifique por tipos de correspondência (Exata e Frase).
+* **Anúncios Responsivos (RSA):** Garanta que você tenha variações suficientes para o Google testar.
+
+### 4. Exportação
+
+Gere um arquivo `.csv` formatado para o **Google Ads Editor**. É muito mais seguro do que subir direto via API se você está começando do zero, pois permite uma revisão final antes de "dar o play".
+
+---
+
+## 🐍 Sugestão de Stack Tecnológica
+
+| Componente | Ferramenta Recomendada |
+| --- | --- |
+| **Linguagem** | Python 3.10+ |
+| **Scraping** | `requests` + `BeautifulSoup4` |
+| **Inteligência** | `api oPENai`  |
+| **Interface** | `Streamlit` (para você colar a URL e ver o resultado na tela) |
+| **Saída** | `pandas` (para gerar o CSV/Excel) |
+
+---
+
+## 💡 Meu "Pulo do Gato" para você
+
+Não peça apenas palavras-chave óbvias. Peça para a IA identificar **"Dores do Cliente"** no texto da sua LP e transformar essas dores em **Extensões de Frase de Destaque (Callouts)**.
+
+**Exemplo:** Se na sua LP diz "Suporte em 5 minutos", o Python deve extrair isso automaticamente como um diferencial do anúncio.
+
+---
--- a/app.py
+++ b/app.py
@@ -0,0 +1,361 @@
+"""
+Google Ads Generator - Interface Streamlit
+
+Aplicação que extrai conteúdo de Landing Pages e gera automaticamente
+ativos de campanha para Google Ads usando IA (OpenAI ou Gemini).
+"""
+
+import os
+import re
+import streamlit as st
+from dotenv import load_dotenv
+
+from src.scraper import scrape_landing_page
+from src.ai_generator import generate_google_ads_assets, MODELS
+from src.exporter import (
+    create_keywords_df,
+    create_negative_keywords_df,
+    create_ads_df,
+    create_sitelinks_df,
+    create_callouts_df,
+    export_all_to_excel,
+)
+
+# ─── Carregar variáveis de ambiente ───────────────────────────────
+load_dotenv()
+
+
+def _highlight_keywords(text: str, keywords: list[str]) -> str:
+    """Destaca em negrito as palavras-chave encontradas no texto."""
+    result = text
+    for kw in keywords:
+        pattern = re.compile(re.escape(kw), re.IGNORECASE)
+        match = pattern.search(result)
+        if match:
+            result = result[:match.start()] + f"**{match.group()}**" + result[match.end():]
+            break  # Destacar apenas a primeira keyword encontrada
+    return result
+
+# ─── Configuração da Página ───────────────────────────────────────
+st.set_page_config(
+    page_title="Google Ads Generator",
+    page_icon="📊",
+    layout="wide",
+)
+
+# ─── CSS Customizado ──────────────────────────────────────────────
+st.markdown("""
+<style>
+    .main-header {
+        font-size: 2.2rem;
+        font-weight: 700;
+        color: #1a73e8;
+        margin-bottom: 0.2rem;
+    }
+    .sub-header {
+        font-size: 1.1rem;
+        color: #5f6368;
+        margin-bottom: 2rem;
+    }
+    .metric-card {
+        background: #f8f9fa;
+        border-radius: 12px;
+        padding: 1.2rem;
+        text-align: center;
+        border: 1px solid #e8eaed;
+    }
+    .metric-number {
+        font-size: 2rem;
+        font-weight: 700;
+        color: #1a73e8;
+    }
+    .metric-label {
+        font-size: 0.85rem;
+        color: #5f6368;
+    }
+    .stTabs [data-baseweb="tab-list"] {
+        gap: 8px;
+    }
+    .stTabs [data-baseweb="tab"] {
+        padding: 10px 20px;
+        border-radius: 8px 8px 0 0;
+    }
+</style>
+""", unsafe_allow_html=True)
+
+# ─── Header ───────────────────────────────────────────────────────
+st.markdown('<p class="main-header">Google Ads Generator</p>', unsafe_allow_html=True)
+st.markdown(
+    '<p class="sub-header">Gere ativos de campanha automaticamente a partir da sua Landing Page</p>',
+    unsafe_allow_html=True,
+)
+
+# ─── Sidebar ──────────────────────────────────────────────────────
+with st.sidebar:
+    st.header("Configurações")
+
+    provider = st.selectbox(
+        "Provider de IA",
+        ["OpenAI", "Gemini"],
+        index=0,
+        help="Escolha o provider de IA. As chaves devem estar configuradas no arquivo .env",
+    )
+
+    model = st.selectbox(
+        "Modelo",
+        MODELS.get(provider, []),
+        index=0,
+        help="Modelo a ser utilizado para geração dos ativos.",
+    )
+
+    # Status das chaves configuradas
+    st.divider()
+    openai_ok = bool(os.environ.get("OPENAI_API_KEY"))
+    gemini_ok = bool(os.environ.get("GEMINI_API_KEY"))
+    st.caption("Status das API Keys (.env):")
+    st.markdown(f"- OpenAI: {'✅ Configurada' if openai_ok else '❌ Não encontrada'}")
+    st.markdown(f"- Gemini: {'✅ Configurada' if gemini_ok else '❌ Não encontrada'}")
+
+    st.divider()
+
+    campaign_name = st.text_input(
+        "Nome da Campanha",
+        value="Campanha LP",
+        help="Nome que aparecerá na coluna 'Campaign' do CSV.",
+    )
+
+    ad_group = st.text_input(
+        "Nome do Grupo de Anúncios",
+        value="Grupo 1",
+        help="Nome que aparecerá na coluna 'Ad Group' do CSV.",
+    )
+
+    st.divider()
+    st.caption("Desenvolvido com Streamlit + OpenAI + Gemini")
+
+# ─── Área Principal ───────────────────────────────────────────────
+url = st.text_input(
+    "URL da Landing Page",
+    placeholder="https://www.seusite.com.br/landing-page",
+    help="Cole a URL completa da sua Landing Page aqui.",
+)
+
+col_btn, col_status = st.columns([1, 3])
+
+with col_btn:
+    generate_btn = st.button("Gerar Campanha", type="primary", use_container_width=True)
+
+# ─── Lógica Principal ────────────────────────────────────────────
+if generate_btn:
+    # Validações
+    if not url:
+        st.error("Por favor, insira a URL da Landing Page.")
+        st.stop()
+
+    if not url.startswith(("http://", "https://")):
+        st.error("A URL deve começar com http:// ou https://")
+        st.stop()
+
+    # Verificar se a chave do provider selecionado está configurada
+    if provider == "OpenAI" and not os.environ.get("OPENAI_API_KEY"):
+        st.error("OPENAI_API_KEY não encontrada no arquivo .env. Configure antes de continuar.")
+        st.stop()
+    elif provider == "Gemini" and not os.environ.get("GEMINI_API_KEY"):
+        st.error("GEMINI_API_KEY não encontrada no arquivo .env. Configure antes de continuar.")
+        st.stop()
+
+    # Step 1: Scraping
+    with st.status("Processando...", expanded=True) as status:
+        st.write("Extraindo conteúdo da Landing Page...")
+        try:
+            lp_data = scrape_landing_page(url)
+        except Exception as e:
+            st.error(f"Erro ao acessar a URL: {e}")
+            st.stop()
+
+        st.write(f"Conteúdo extraído: {len(lp_data['paragraphs'])} parágrafos, "
+                 f"{len(lp_data['h1'])} H1, {len(lp_data['h2'])} H2, "
+                 f"{len(lp_data.get('list_items', []))} itens de lista, "
+                 f"{len(lp_data['ctas'])} CTAs")
+
+        # Step 2: IA
+        st.write(f"Gerando ativos com {provider} ({model})...")
+        try:
+            assets, prompts = generate_google_ads_assets(
+                lp_content=lp_data["full_text"],
+                provider=provider,
+                model=model,
+            )
+        except ValueError as e:
+            st.error(str(e))
+            st.stop()
+        except Exception as e:
+            st.error(f"Erro ao gerar ativos: {e}")
+            st.stop()
+
+        status.update(label="Concluído!", state="complete", expanded=False)
+
+    # Salvar no session_state
+    st.session_state["assets"] = assets
+    st.session_state["prompts"] = prompts
+    st.session_state["lp_data"] = lp_data
+    st.session_state["campaign_name"] = campaign_name
+    st.session_state["ad_group"] = ad_group
+    st.session_state["provider_used"] = provider
+    st.session_state["model_used"] = model
+
+# ─── Exibição dos Resultados ─────────────────────────────────────
+if "assets" in st.session_state:
+    assets = st.session_state["assets"]
+    prompts = st.session_state.get("prompts", {})
+    camp = st.session_state.get("campaign_name", "Campanha LP")
+    adg = st.session_state.get("ad_group", "Grupo 1")
+    prov_used = st.session_state.get("provider_used", "")
+    model_used = st.session_state.get("model_used", "")
+
+    st.divider()
+
+    # Métricas resumo
+    col1, col2, col3, col4, col5, col6 = st.columns(6)
+
+    with col1:
+        st.metric("Keywords", len(assets.get("keywords", [])))
+    with col2:
+        st.metric("Negativas", len(assets.get("negative_keywords", [])))
+    with col3:
+        st.metric("Títulos", len(assets.get("headlines", [])))
+    with col4:
+        st.metric("Descrições", len(assets.get("descriptions", [])))
+    with col5:
+        st.metric("Sitelinks", len(assets.get("sitelinks", [])))
+    with col6:
+        st.metric("Callouts", len(assets.get("callouts", [])))
+
+    st.divider()
+
+    # Abas com resultados
+    tab_kw, tab_neg, tab_ads, tab_sl, tab_co, tab_prompts, tab_raw = st.tabs([
+        "Keywords", "Negativas", "Anúncios RSA", "Sitelinks", "Callouts",
+        "Prompts Utilizados", "Dados da LP",
+    ])
+
+    with tab_kw:
+        st.subheader("Palavras-chave")
+        kw_df = create_keywords_df(assets, camp, adg)
+        if not kw_df.empty:
+            st.dataframe(kw_df, use_container_width=True, hide_index=True)
+        else:
+            st.info("Nenhuma palavra-chave gerada.")
+
+    with tab_neg:
+        st.subheader("Palavras-chave Negativas")
+        nkw_df = create_negative_keywords_df(assets, camp)
+        if not nkw_df.empty:
+            st.dataframe(nkw_df, use_container_width=True, hide_index=True)
+        else:
+            st.info("Nenhuma palavra-chave negativa gerada.")
+
+    with tab_ads:
+        st.subheader("Anúncio Responsivo de Pesquisa (RSA)")
+
+        st.write("**Títulos (Headlines):**")
+        # Coletar palavras-chave para destacar nos títulos
+        kw_list = sorted(
+            [kw["keyword"].lower() for kw in assets.get("keywords", []) if kw.get("keyword")],
+            key=len, reverse=True,  # Maior primeiro para evitar match parcial
+        )
+        for i, h in enumerate(assets.get("headlines", []), 1):
+            char_count = len(h)
+            color = "green" if char_count <= 30 else "red"
+            h_highlighted = _highlight_keywords(h, kw_list)
+            st.markdown(f"{i}. {h_highlighted} — :{color}[{char_count} chars]")
+
+        st.write("**Descrições:**")
+        for i, d in enumerate(assets.get("descriptions", []), 1):
+            char_count = len(d)
+            color = "green" if char_count <= 90 else "red"
+            st.markdown(f"{i}. {d} — :{color}[{char_count} chars]")
+
+        st.divider()
+        ads_df = create_ads_df(assets, camp, adg)
+        if not ads_df.empty:
+            st.dataframe(ads_df, use_container_width=True, hide_index=True)
+
+    with tab_sl:
+        st.subheader("Sitelinks")
+        sl_df = create_sitelinks_df(assets, camp)
+        if not sl_df.empty:
+            st.dataframe(sl_df, use_container_width=True, hide_index=True)
+        else:
+            st.info("Nenhum sitelink gerado.")
+
+    with tab_co:
+        st.subheader("Callouts (Frases de Destaque)")
+        co_df = create_callouts_df(assets, camp)
+        if not co_df.empty:
+            st.dataframe(co_df, use_container_width=True, hide_index=True)
+        else:
+            st.info("Nenhum callout gerado.")
+
+    with tab_prompts:
+        st.subheader("Prompts Utilizados")
+        st.caption(f"Provider: **{prov_used}** | Modelo: **{model_used}**")
+
+        st.markdown("#### Prompt de Sistema (System Prompt)")
+        st.code(prompts.get("system_prompt", "N/A"), language=None)
+
+        st.markdown("#### Prompt do Usuário (User Prompt)")
+        st.code(prompts.get("user_prompt", "N/A"), language=None)
+
+    with tab_raw:
+        st.subheader("Dados Extraídos da Landing Page")
+        lp_data = st.session_state.get("lp_data", {})
+        if lp_data:
+            st.write(f"**URL:** {lp_data.get('url', '')}")
+            st.write(f"**Título:** {lp_data.get('title', '')}")
+            st.write(f"**Meta Description:** {lp_data.get('meta_description', '')}")
+
+            with st.expander("Headings (H1, H2, H3)"):
+                for h in lp_data.get("h1", []):
+                    st.write(f"**H1:** {h}")
+                for h in lp_data.get("h2", []):
+                    st.write(f"**H2:** {h}")
+                for h in lp_data.get("h3", []):
+                    st.write(f"**H3:** {h}")
+
+            with st.expander("Itens de Lista / Benefícios"):
+                for li in lp_data.get("list_items", []):
+                    st.write(f"- {li}")
+
+            with st.expander("CTAs Encontrados"):
+                for c in lp_data.get("ctas", []):
+                    st.write(f"- {c}")
+
+            with st.expander("Texto Completo Enviado à IA"):
+                st.code(lp_data.get("full_text", ""), language=None)
+
+    # ─── Botões de Download ───────────────────────────────────────
+    st.divider()
+    st.subheader("Download dos Ativos")
+
+    col_dl1, col_dl2 = st.columns(2)
+
+    with col_dl1:
+        excel_data = export_all_to_excel(assets, camp, adg)
+        st.download_button(
+            label="Baixar Excel (.xlsx)",
+            data=excel_data,
+            file_name="google_ads_assets.xlsx",
+            mime="application/vnd.openxmlformats-officedocument.spreadsheetml.sheet",
+            use_container_width=True,
+        )
+
+    with col_dl2:
+        kw_csv = create_keywords_df(assets, camp, adg).to_csv(index=False)
+        st.download_button(
+            label="Baixar Keywords (.csv)",
+            data=kw_csv,
+            file_name="google_ads_keywords.csv",
+            mime="text/csv",
+            use_container_width=True,
+        )
--- a/app.zip
+++ b/app.zip
--- a/github.bat
+++ b/github.bat
@@ -0,0 +1,30 @@
+@echo off
+echo === INICIANDO UPLOAD PARA GITHUB ===
+
+REM Inicializar repositório Git
+echo Inicializando repositorio Git...
+git init
+
+REM Adicionar todos os arquivos
+echo Adicionando todos os arquivos...
+git add .
+
+REM Fazer commit inicial
+echo Realizando commit inicial...
+git commit -m "Commit inicial - upload de todos os arquivos da pasta"
+
+REM Adicionar repositório remoto
+echo Conectando ao repositorio remoto...
+git remote add origin https://gitea.aplicativopro.com/wander/Google-Ads.git
+
+REM Definir branch principal
+echo Definindo branch principal como 'main'...
+git branch -M main
+
+REM Fazer push para o GitHub
+echo Fazendo upload para o GitHub...
+git push -u origin main
+
+echo === UPLOAD CONCLUIDO COM SUCESSO! ===
+
+pause
--- a/google_ads_assets.xlsx
+++ b/google_ads_assets.xlsx
--- a/(1).csv
+++ b/(1).csv
@@ -0,0 +1,21 @@
+Campaign,Ad Group,Keyword,Match Type,Status
+Campanha LP,Grupo 1,[advogado divórcio online],Exact,Enabled
+Campanha LP,Grupo 1,"""advogado guarda filhos""",Phrase,Enabled
+Campanha LP,Grupo 1,"""advogado pensão alimentícia""",Phrase,Enabled
+Campanha LP,Grupo 1,[divórcio extrajudicial online],Exact,Enabled
+Campanha LP,Grupo 1,"""advogado inventário SP""",Phrase,Enabled
+Campanha LP,Grupo 1,[calcular pensão alimentícia],Exact,Enabled
+Campanha LP,Grupo 1,"""divórcio amigável online""",Phrase,Enabled
+Campanha LP,Grupo 1,"""advogado união estável SP""",Phrase,Enabled
+Campanha LP,Grupo 1,[contratar advogado divórcio],Exact,Enabled
+Campanha LP,Grupo 1,"""advogado especialista família""",Phrase,Enabled
+Campanha LP,Grupo 1,[consulta advogado divórcio],Exact,Enabled
+Campanha LP,Grupo 1,"""advogado guarda compartilhada""",Phrase,Enabled
+Campanha LP,Grupo 1,[honorários advogado divórcio],Exact,Enabled
+Campanha LP,Grupo 1,"""advogado pensão alimentícia SP""",Phrase,Enabled
+Campanha LP,Grupo 1,[divórcio rápido online],Exact,Enabled
+Campanha LP,Grupo 1,"""advogado inventário judicial""",Phrase,Enabled
+Campanha LP,Grupo 1,[custo advogado divórcio],Exact,Enabled
+Campanha LP,Grupo 1,"""advogado especialista em família""",Phrase,Enabled
+Campanha LP,Grupo 1,[falar com advogado divórcio],Exact,Enabled
+Campanha LP,Grupo 1,"""advogado divórcio preço""",Phrase,Enabled
--- a/google_ads_keywords.csv
+++ b/google_ads_keywords.csv
@@ -0,0 +1,16 @@
+Campaign,Ad Group,Keyword,Match Type,Status
+Campanha LP,Grupo 1,[advogados trabalhistas],Exact,Enabled
+Campanha LP,Grupo 1,"""consultoria jurídica online""",Phrase,Enabled
+Campanha LP,Grupo 1,[direitos do trabalhador],Exact,Enabled
+Campanha LP,Grupo 1,"""demissão injusta""",Phrase,Enabled
+Campanha LP,Grupo 1,[horas extras não pagas],Exact,Enabled
+Campanha LP,Grupo 1,"""assédio moral advogado""",Phrase,Enabled
+Campanha LP,Grupo 1,[rescisão de contrato],Exact,Enabled
+Campanha LP,Grupo 1,"""consultoria gratuita advogados""",Phrase,Enabled
+Campanha LP,Grupo 1,[direito do trabalho],Exact,Enabled
+Campanha LP,Grupo 1,"""advocacia online""",Phrase,Enabled
+Campanha LP,Grupo 1,[defesa de direitos trabalhistas],Exact,Enabled
+Campanha LP,Grupo 1,"""avaliação jurídica gratuita""",Phrase,Enabled
+Campanha LP,Grupo 1,[advogado demissão],Exact,Enabled
+Campanha LP,Grupo 1,"""horas extras advogado""",Phrase,Enabled
+Campanha LP,Grupo 1,[consultar advogado online],Exact,Enabled
--- a/planejamento.md
+++ b/planejamento.md
@@ -0,0 +1,56 @@
+# Google Ads Generator from LP
+
+## Arquitetura do Projeto
+
+O projeto seguirá a estrutura modular sugerida:
+1.  **Interface (Streamlit):** Entrada da URL e Chave da API, exibição dos resultados e botão de download.
+2.  **Scraper (BeautifulSoup):** Extração de texto visível, títulos e meta tags da URL fornecida.
+3.  **IA (OpenAI API):** Geração de palavras-chave, títulos, descrições e extensões com base no conteúdo extraído.
+4.  **Processamento e Exportação (Pandas):** Formatação dos dados para CSV compatível com Google Ads Editor.
+
+## Passos de Implementação
+
+### 1. Configuração do Ambiente
+- Criar arquivo `requirements.txt` com as dependências: `streamlit`, `pandas`, `requests`, `beautifulsoup4`, `openai`, `python-dotenv`.
+- Configurar estrutura de pastas.
+
+### 2. Módulo de Scraping (`src/scraper.py`)
+- Criar função `scrape_landing_page(url)` que retorna um dicionário com:
+    - Título da página (`title`)
+    - Meta description
+    - Headings (`h1`, `h2`, `h3`)
+    - Texto principal (parágrafos relevantes)
+    - Texto de botões/CTAs
+
+### 3. Módulo de IA (`src/ai_generator.py`)
+- Configurar cliente OpenAI.
+- Criar prompts específicos para:
+    - **Palavras-chave:** Fundo de funil, com tipos de correspondência (Exata, Frase).
+    - **Palavras-chave Negativas:** Identificar termos irrelevantes ou que atraiam tráfego desqualificado com base no conteúdo da LP.
+    - **Anúncios Responsivos (RSA):** 15 títulos (30 chars) e 4 descrições (90 chars).
+    - **Sitelinks:** 4 variações com texto e descrição.
+    - **Callouts (Frases de Destaque):** Extração de "Dores do Cliente" e diferenciais (o "Pulo do Gato").
+
+### 4. Módulo de Exportação (`src/exporter.py`)
+- Criar função para estruturar os dados em um DataFrame do Pandas.
+- Mapear colunas para o formato padrão do Google Ads Editor (ex: `Campaign`, `Ad Group`, `Keyword`, `Headline 1`, etc.).
+- Gerar CSV para download.
+
+### 5. Interface do Usuário (`app.py`)
+- Criar layout com Streamlit.
+- Campo para input da URL.
+- Campo para input da OpenAI API Key (opcional se usar .env, mas bom para interface).
+- Botão "Gerar Campanha".
+- Exibição dos resultados em abas (Keywords, Negative Keywords, Ads, Extensions).
+- Botão de download do CSV final.
+
+OpenAI (do mais barato ao mais caro):
+gpt-4.1-mini -- mais recente e barato
+gpt-4o-mini -- otimo custo-beneficio
+gpt-4.1 -- mais capaz, custo moderado
+gpt-4o -- alta qualidade
+Gemini (do mais barato ao mais caro):
+gemini-2.0-flash-lite -- mais barato do Gemini
+gemini-2.0-flash -- equilibrio custo/qualidade
+gemini-2.5-flash-lite -- mais recente
+gemini-1.5-flash -- estavel e confiavel
--- a/requirements.txt
+++ b/requirements.txt
@@ -0,0 +1,10 @@
+streamlit
+pandas
+requests
+beautifulsoup4
+openai
+python-dotenv
+openpyxl
+google-genai
+selenium
+webdriver-manager
--- a/src/init.py
+++ b/src/init.py
--- a/src/pycache/init.cpython-310.pyc
+++ b/src/pycache/init.cpython-310.pyc
--- a/src/pycache/ai_generator.cpython-310.pyc
+++ b/src/pycache/ai_generator.cpython-310.pyc
--- a/src/pycache/exporter.cpython-310.pyc
+++ b/src/pycache/exporter.cpython-310.pyc
--- a/src/pycache/scraper.cpython-310.pyc
+++ b/src/pycache/scraper.cpython-310.pyc
--- a/src/ai_generator.py
+++ b/src/ai_generator.py
@@ -0,0 +1,263 @@
+"""
+Módulo de IA - Geração de ativos para Google Ads via OpenAI ou Gemini.
+
+Recebe o conteúdo extraído da LP e gera palavras-chave,
+anúncios responsivos, sitelinks, callouts e palavras-chave negativas.
+Suporta múltiplos providers de IA (OpenAI e Google Gemini).
+"""
+
+import json
+import os
+import time
+import re
+from openai import OpenAI
+from google import genai
+
+
+# ─── Modelos disponíveis por provider ─────────────────────────────
+MODELS = {
+    "OpenAI": ["gpt-4.1-mini", "gpt-4o-mini", "gpt-4.1", "gpt-4o"],
+    "Gemini": ["gemini-2.0-flash-lite", "gemini-2.0-flash", "gemini-2.5-flash-lite", "gemini-1.5-flash"],
+}
+
+
+def generate_google_ads_assets(
+    lp_content: str,
+    provider: str = "OpenAI",
+    model: str = "gpt-4o-mini",
+) -> tuple[dict, dict]:
+    """
+    Gera todos os ativos de campanha Google Ads a partir do conteúdo da LP.
+
+    Args:
+        lp_content: Texto completo extraído da LP (full_text do scraper).
+        provider: Provider de IA ("OpenAI" ou "Gemini").
+        model: Modelo a ser usado (deve ser compatível com o provider).
+
+    Returns:
+        Tupla com:
+        - assets: Dicionário com keywords, negative_keywords, headlines, etc.
+        - prompts: Dicionário com system_prompt e user_prompt usados.
+    """
+    system_prompt = _build_system_prompt()
+    user_prompt = _build_user_prompt(lp_content)
+
+    prompts = {
+        "system_prompt": system_prompt,
+        "user_prompt": user_prompt,
+    }
+
+    if provider == "OpenAI":
+        raw_response = _call_openai(system_prompt, user_prompt, model)
+    elif provider == "Gemini":
+        raw_response = _call_gemini(system_prompt, user_prompt, model)
+    else:
+        raise ValueError(f"Provider não suportado: {provider}")
+
+    # Limpar possíveis blocos de código markdown
+    raw_response = _clean_json_response(raw_response)
+
+    result = json.loads(raw_response)
+    assets = _validate_and_normalize(result)
+
+    return assets, prompts
+
+
+def _call_openai(system_prompt: str, user_prompt: str, model: str) -> str:
+    """Chama a API da OpenAI e retorna a resposta bruta."""
+    api_key = os.environ.get("OPENAI_API_KEY")
+    if not api_key:
+        raise ValueError("OPENAI_API_KEY não encontrada no arquivo .env")
+
+    client = OpenAI(api_key=api_key)
+
+    response = client.chat.completions.create(
+        model=model,
+        messages=[
+            {"role": "system", "content": system_prompt},
+            {"role": "user", "content": user_prompt},
+        ],
+        temperature=0.7,
+        max_tokens=4000,
+    )
+
+    return response.choices[0].message.content.strip()
+
+
+def _call_gemini(system_prompt: str, user_prompt: str, model: str, max_retries: int = 2) -> str:
+    """
+    Chama a API do Google Gemini e retorna a resposta bruta.
+    Faz retry automático em caso de rate limit (429).
+    """
+    api_key = os.environ.get("GEMINI_API_KEY")
+    if not api_key:
+        raise ValueError("GEMINI_API_KEY não encontrada no arquivo .env")
+
+    client = genai.Client(api_key=api_key)
+
+    for attempt in range(max_retries + 1):
+        try:
+            response = client.models.generate_content(
+                model=model,
+                contents=user_prompt,
+                config=genai.types.GenerateContentConfig(
+                    system_instruction=system_prompt,
+                    temperature=0.7,
+                    max_output_tokens=4000,
+                ),
+            )
+            return response.text.strip()
+
+        except Exception as e:
+            error_str = str(e)
+            if "429" in error_str or "RESOURCE_EXHAUSTED" in error_str:
+                # Extrair tempo de retry sugerido pela API
+                wait_match = re.search(r"retry.*?(\d+)", error_str, re.IGNORECASE)
+                wait_seconds = int(wait_match.group(1)) if wait_match else 45
+
+                if attempt < max_retries:
+                    time.sleep(wait_seconds)
+                    continue
+                else:
+                    raise ValueError(
+                        f"Gemini API: Limite de requisições excedido (Free Tier). "
+                        f"Aguarde ~{wait_seconds}s e tente novamente, ou mude para um "
+                        f"plano pago em https://ai.google.dev/pricing. "
+                        f"Alternativa: use o provider OpenAI."
+                    ) from e
+            else:
+                raise
+
+
+def _clean_json_response(raw: str) -> str:
+    """Remove blocos de código markdown e extrai apenas o JSON."""
+    raw = raw.strip()
+    if raw.startswith("```"):
+        raw = raw.split("\n", 1)[1]
+        if raw.endswith("```"):
+            raw = raw[:-3]
+        raw = raw.strip()
+    return raw
+
+
+def _build_system_prompt() -> str:
+    """Constrói o prompt de sistema."""
+    return (
+        "Você é um especialista em Google Ads com mais de 10 anos de experiência. "
+        "Seu trabalho é gerar ativos de campanha de alta performance a partir do "
+        "conteúdo de Landing Pages. Responda SEMPRE em formato JSON válido, "
+        "sem markdown, sem blocos de código. Apenas o JSON puro."
+    )
+
+
+def _build_user_prompt(lp_content: str) -> str:
+    """Constrói o prompt do usuário para geração de ativos."""
+    return f"""Com base no conteúdo desta Landing Page, gere ativos completos para uma campanha de Google Ads.
+
+=== CONTEÚDO DA LANDING PAGE ===
+{lp_content}
+=== FIM DO CONTEÚDO ===
+
+Gere o seguinte em formato JSON:
+
+{{
+  "keywords": [
+    {{"keyword": "exemplo de palavra-chave", "match_type": "Exact"}},
+    {{"keyword": "outro exemplo", "match_type": "Phrase"}}
+  ],
+  "negative_keywords": [
+    {{"keyword": "grátis", "reason": "Atrai tráfego que não converte"}},
+    {{"keyword": "como fazer", "reason": "Topo de funil, não converte"}}
+  ],
+  "headlines": [
+    "Título com até 30 caracteres"
+  ],
+  "descriptions": [
+    "Descrição com até 90 caracteres que destaca benefícios e inclui CTA"
+  ],
+  "sitelinks": [
+    {{"title": "Título do Sitelink", "description1": "Linha 1", "description2": "Linha 2"}}
+  ],
+  "callouts": [
+    "Frase de destaque curta"
+  ]
+}}
+
+REGRAS OTIMIZADAS PARA GOOGLE ADS:
+
+1. PALAVRAS-CHAVE (Fundo de Funil): Gere 20 termos com alta intenção de contratação. Use [Exata] e "Frase". Limite os termos a no máximo 25 caracteres para viabilizar o uso nos títulos.
+2. NEGATIVAS: Gere 20 termos que filtrem estudantes, curiosos e buscas gratuitas (ex: pdf, curso, modelo, jurisprudência, tcc).
+3. TÍTULOS (Headlines): Gere 15 títulos (máx. 30 caracteres). Regra de Ouro: A palavra-chave da Regra 1 deve aparecer de forma INTEGRAL e IDENTICA no título. Se a keyword for longa, o título será apenas ela.
+4. DESCRIÇÕES: Gere 4 descrições (máx. 90 caracteres). Devem terminar obrigatoriamente com um ponto final ou exclamação. Inclua uma Proposta Única de Valor (UVP).
+5. EXTENSÕES (Sitelinks & Callouts): 
+   - 4 Sitelinks (Título 25ch / Desc 35ch).
+   - 6 Callouts (Frases de destaque, máx 25ch) focadas em autoridade e agilidade.
+6. POLÍTICAS EDITORIAIS: 
+   - Proibido: "Grátis" e sinônimos.
+   - Proibido: CAIXA ALTA em palavras inteiras (exceto siglas como SP, OAB).
+   - Proibido: Uso excessivo de pontuação (ex: !!!).
+
+RETORNO: Apenas o JSON estruturado."""
+
+def _validate_and_normalize(data: dict) -> dict:
+    """Valida e normaliza os dados retornados pela IA."""
+    result = {
+        "keywords": [],
+        "negative_keywords": [],
+        "headlines": [],
+        "descriptions": [],
+        "sitelinks": [],
+        "callouts": [],
+    }
+
+    # Keywords
+    for kw in data.get("keywords", []):
+        if isinstance(kw, dict) and "keyword" in kw:
+            result["keywords"].append({
+                "keyword": kw["keyword"],
+                "match_type": kw.get("match_type", "Phrase"),
+            })
+        elif isinstance(kw, str):
+            result["keywords"].append({"keyword": kw, "match_type": "Phrase"})
+
+    # Negative Keywords
+    for nkw in data.get("negative_keywords", []):
+        if isinstance(nkw, dict) and "keyword" in nkw:
+            result["negative_keywords"].append({
+                "keyword": nkw["keyword"],
+                "reason": nkw.get("reason", ""),
+            })
+        elif isinstance(nkw, str):
+            result["negative_keywords"].append({"keyword": nkw, "reason": ""})
+
+    # Headlines - garantir limite de 30 chars
+    for h in data.get("headlines", []):
+        if isinstance(h, str) and len(h) <= 30:
+            result["headlines"].append(h)
+        elif isinstance(h, str):
+            result["headlines"].append(h[:30])
+
+    # Descriptions - garantir limite de 90 chars
+    for d in data.get("descriptions", []):
+        if isinstance(d, str) and len(d) <= 90:
+            result["descriptions"].append(d)
+        elif isinstance(d, str):
+            result["descriptions"].append(d[:90])
+
+    # Sitelinks
+    for sl in data.get("sitelinks", []):
+        if isinstance(sl, dict) and "title" in sl:
+            result["sitelinks"].append({
+                "title": sl.get("title", "")[:25],
+                "description1": sl.get("description1", "")[:35],
+                "description2": sl.get("description2", "")[:35],
+            })
+
+    # Callouts
+    for c in data.get("callouts", []):
+        if isinstance(c, str) and len(c) <= 25:
+            result["callouts"].append(c)
+        elif isinstance(c, str):
+            result["callouts"].append(c[:25])
+
+    return result
--- a/src/exporter.py
+++ b/src/exporter.py
@@ -0,0 +1,163 @@
+"""
+Módulo de Exportação - Gera arquivos CSV compatíveis com Google Ads Editor.
+
+Recebe os ativos gerados pela IA e os formata em DataFrames do Pandas,
+prontos para importação no Google Ads Editor.
+"""
+
+import pandas as pd
+from io import BytesIO
+
+
+def create_keywords_df(assets: dict, campaign_name: str = "Campanha LP", ad_group: str = "Grupo 1") -> pd.DataFrame:
+    """Cria DataFrame de palavras-chave no formato Google Ads Editor."""
+    rows = []
+    for kw in assets.get("keywords", []):
+        match_type = kw.get("match_type", "Phrase")
+        keyword = kw.get("keyword", "")
+
+        # Formatar keyword conforme tipo de correspondência
+        if match_type == "Exact":
+            formatted_kw = f"[{keyword}]"
+        elif match_type == "Phrase":
+            formatted_kw = f'"{keyword}"'
+        else:
+            formatted_kw = keyword
+
+        rows.append({
+            "Campaign": campaign_name,
+            "Ad Group": ad_group,
+            "Keyword": formatted_kw,
+            "Match Type": match_type,
+            "Status": "Enabled",
+        })
+
+    return pd.DataFrame(rows)
+
+
+def create_negative_keywords_df(assets: dict, campaign_name: str = "Campanha LP") -> pd.DataFrame:
+    """Cria DataFrame de palavras-chave negativas no formato Google Ads Editor."""
+    rows = []
+    for nkw in assets.get("negative_keywords", []):
+        rows.append({
+            "Campaign": campaign_name,
+            "Keyword": nkw.get("keyword", ""),
+            "Criterion Type": "Negative",
+            "Reason": nkw.get("reason", ""),
+        })
+
+    return pd.DataFrame(rows)
+
+
+def create_ads_df(assets: dict, campaign_name: str = "Campanha LP", ad_group: str = "Grupo 1") -> pd.DataFrame:
+    """Cria DataFrame do anúncio responsivo (RSA) no formato Google Ads Editor."""
+    headlines = assets.get("headlines", [])
+    descriptions = assets.get("descriptions", [])
+
+    row = {
+        "Campaign": campaign_name,
+        "Ad Group": ad_group,
+        "Ad Type": "Responsive Search Ad",
+    }
+
+    # Preencher até 15 headlines
+    for i, h in enumerate(headlines[:15], start=1):
+        row[f"Headline {i}"] = h
+
+    # Preencher até 4 descrições
+    for i, d in enumerate(descriptions[:4], start=1):
+        row[f"Description {i}"] = d
+
+    return pd.DataFrame([row])
+
+
+def create_sitelinks_df(assets: dict, campaign_name: str = "Campanha LP") -> pd.DataFrame:
+    """Cria DataFrame de sitelinks no formato Google Ads Editor."""
+    rows = []
+    for sl in assets.get("sitelinks", []):
+        rows.append({
+            "Campaign": campaign_name,
+            "Sitelink Text": sl.get("title", ""),
+            "Description Line 1": sl.get("description1", ""),
+            "Description Line 2": sl.get("description2", ""),
+        })
+
+    return pd.DataFrame(rows)
+
+
+def create_callouts_df(assets: dict, campaign_name: str = "Campanha LP") -> pd.DataFrame:
+    """Cria DataFrame de callouts no formato Google Ads Editor."""
+    rows = []
+    for c in assets.get("callouts", []):
+        rows.append({
+            "Campaign": campaign_name,
+            "Callout Text": c,
+        })
+
+    return pd.DataFrame(rows)
+
+
+def export_all_to_excel(assets: dict, campaign_name: str = "Campanha LP", ad_group: str = "Grupo 1") -> BytesIO:
+    """
+    Exporta todos os ativos em um único arquivo Excel com múltiplas abas.
+
+    Returns:
+        BytesIO com o conteúdo do arquivo Excel.
+    """
+    output = BytesIO()
+
+    with pd.ExcelWriter(output, engine="openpyxl") as writer:
+        kw_df = create_keywords_df(assets, campaign_name, ad_group)
+        if not kw_df.empty:
+            kw_df.to_excel(writer, sheet_name="Keywords", index=False)
+
+        nkw_df = create_negative_keywords_df(assets, campaign_name)
+        if not nkw_df.empty:
+            nkw_df.to_excel(writer, sheet_name="Negative Keywords", index=False)
+
+        ads_df = create_ads_df(assets, campaign_name, ad_group)
+        if not ads_df.empty:
+            ads_df.to_excel(writer, sheet_name="Ads RSA", index=False)
+
+        sl_df = create_sitelinks_df(assets, campaign_name)
+        if not sl_df.empty:
+            sl_df.to_excel(writer, sheet_name="Sitelinks", index=False)
+
+        co_df = create_callouts_df(assets, campaign_name)
+        if not co_df.empty:
+            co_df.to_excel(writer, sheet_name="Callouts", index=False)
+
+    output.seek(0)
+    return output
+
+
+def export_all_to_csv(assets: dict, campaign_name: str = "Campanha LP", ad_group: str = "Grupo 1") -> dict[str, str]:
+    """
+    Exporta todos os ativos como strings CSV separadas.
+
+    Returns:
+        Dicionário com nome da aba -> conteúdo CSV.
+    """
+    csvs = {}
+
+    kw_df = create_keywords_df(assets, campaign_name, ad_group)
+    if not kw_df.empty:
+        csvs["keywords"] = kw_df.to_csv(index=False)
+
+    nkw_df = create_negative_keywords_df(assets, campaign_name)
+    if not nkw_df.empty:
+        csvs["negative_keywords"] = nkw_df.to_csv(index=False)
+
+    ads_df = create_ads_df(assets, campaign_name, ad_group)
+    if not ads_df.empty:
+        csvs["ads"] = ads_df.to_csv(index=False)
+
+    sl_df = create_sitelinks_df(assets, campaign_name)
+    if not sl_df.empty:
+        csvs["sitelinks"] = sl_df.to_csv(index=False)
+
+    co_df = create_callouts_df(assets, campaign_name)
+    if not co_df.empty:
+        csvs["callouts"] = co_df.to_csv(index=False)
+
+    return csvs
--- a/src/scraper.py
+++ b/src/scraper.py
@@ -0,0 +1,265 @@
+"""
+Módulo de Scraping - Extração de conteúdo de Landing Pages.
+
+Utiliza Selenium (Chrome headless) + BeautifulSoup4 para extrair
+títulos, textos, CTAs e meta tags de uma Landing Page fornecida via URL.
+O Selenium renderiza o JavaScript antes da extração, garantindo que
+todo o conteúdo dinâmico seja capturado.
+"""
+
+import time
+from bs4 import BeautifulSoup
+from selenium import webdriver
+from selenium.webdriver.chrome.options import Options
+from selenium.webdriver.chrome.service import Service
+from selenium.webdriver.common.by import By
+from selenium.webdriver.support.ui import WebDriverWait
+from selenium.webdriver.support import expected_conditions as EC
+from webdriver_manager.chrome import ChromeDriverManager
+
+
+def _create_driver() -> webdriver.Chrome:
+    """Cria e retorna um driver Chrome headless."""
+    options = Options()
+    options.add_argument("--headless=new")
+    options.add_argument("--no-sandbox")
+    options.add_argument("--disable-dev-shm-usage")
+    options.add_argument("--disable-gpu")
+    options.add_argument("--window-size=1920,1080")
+    options.add_argument("--disable-extensions")
+    options.add_argument("--disable-infobars")
+    options.add_argument(
+        "user-agent=Mozilla/5.0 (Windows NT 10.0; Win64; x64) "
+        "AppleWebKit/537.36 (KHTML, like Gecko) "
+        "Chrome/120.0.0.0 Safari/537.36"
+    )
+    # Suprimir logs do Chrome
+    options.add_argument("--log-level=3")
+    options.add_experimental_option("excludeSwitches", ["enable-logging"])
+
+    service = Service(ChromeDriverManager().install())
+    driver = webdriver.Chrome(service=service, options=options)
+    return driver
+
+
+def scrape_landing_page(url: str, wait_seconds: int = 5) -> dict:
+    """
+    Faz scraping de uma Landing Page usando Selenium (Chrome headless)
+    e retorna um dicionário com os elementos relevantes para geração de anúncios.
+
+    Args:
+        url: URL completa da Landing Page.
+        wait_seconds: Segundos para aguardar o carregamento do JS.
+
+    Returns:
+        Dicionário com as chaves:
+        - url: URL original
+        - title: Título da página (<title>)
+        - meta_description: Conteúdo da meta description
+        - h1: Lista de textos dos <h1>
+        - h2: Lista de textos dos <h2>
+        - h3: Lista de textos dos <h3>
+        - paragraphs: Lista dos parágrafos principais
+        - ctas: Lista de textos de botões e links de ação
+        - full_text: Texto completo concatenado (para envio à IA)
+    """
+    driver = _create_driver()
+
+    try:
+        driver.get(url)
+
+        # Aguardar o body estar presente (sinal de que a página carregou)
+        WebDriverWait(driver, 15).until(
+            EC.presence_of_element_located((By.TAG_NAME, "body"))
+        )
+
+        # Aguardar tempo extra para JavaScript renderizar conteúdo dinâmico
+        time.sleep(wait_seconds)
+
+        # Scroll até o final para disparar lazy-loading
+        driver.execute_script("window.scrollTo(0, document.body.scrollHeight);")
+        time.sleep(2)
+
+        # Capturar HTML completo após renderização
+        page_source = driver.page_source
+
+    finally:
+        driver.quit()
+
+    # Parsear com BeautifulSoup
+    soup = BeautifulSoup(page_source, "html.parser")
+
+    # Remover scripts e styles para limpeza do texto
+    for tag in soup(["script", "style", "noscript", "iframe", "svg"]):
+        tag.decompose()
+
+    # Título da página
+    title = soup.title.string.strip() if soup.title and soup.title.string else ""
+
+    # Meta description
+    meta_desc_tag = soup.find("meta", attrs={"name": "description"})
+    meta_description = ""
+    if meta_desc_tag and meta_desc_tag.get("content"):
+        meta_description = meta_desc_tag["content"].strip()
+
+    # Headings
+    h1_tags = [tag.get_text(strip=True) for tag in soup.find_all("h1") if tag.get_text(strip=True)]
+    h2_tags = [tag.get_text(strip=True) for tag in soup.find_all("h2") if tag.get_text(strip=True)]
+    h3_tags = [tag.get_text(strip=True) for tag in soup.find_all("h3") if tag.get_text(strip=True)]
+
+    # Parágrafos relevantes (ignora parágrafos muito curtos)
+    paragraphs = [
+        tag.get_text(strip=True)
+        for tag in soup.find_all("p")
+        if tag.get_text(strip=True) and len(tag.get_text(strip=True)) > 20
+    ]
+
+    # Lista items (muitas LPs usam <li> para benefícios)
+    list_items = [
+        tag.get_text(strip=True)
+        for tag in soup.find_all("li")
+        if tag.get_text(strip=True) and 10 < len(tag.get_text(strip=True)) < 200
+    ]
+
+    # Spans e divs com texto significativo (para LPs que não usam <p>)
+    extra_texts = _extract_visible_text_blocks(soup)
+
+    # CTAs - botões e links com texto de ação
+    ctas = _extract_ctas(soup)
+
+    # Texto completo para enviar à IA
+    full_text = _build_full_text(
+        title, meta_description, h1_tags, h2_tags, h3_tags,
+        paragraphs, list_items, extra_texts, ctas,
+    )
+
+    return {
+        "url": url,
+        "title": title,
+        "meta_description": meta_description,
+        "h1": h1_tags,
+        "h2": h2_tags,
+        "h3": h3_tags,
+        "paragraphs": paragraphs,
+        "list_items": list_items,
+        "ctas": ctas,
+        "full_text": full_text,
+    }
+
+
+def _extract_visible_text_blocks(soup: BeautifulSoup) -> list[str]:
+    """
+    Extrai blocos de texto visível de divs e spans que não estão
+    dentro de tags semânticas (p, h1-h6, li, button, a).
+    Útil para LPs que usam divs customizados para conteúdo.
+    """
+    semantic_tags = {"p", "h1", "h2", "h3", "h4", "h5", "h6", "li", "button", "a", "input", "label"}
+    texts = []
+    seen = set()
+
+    for tag in soup.find_all(["div", "span"]):
+        # Pular se tem filhos que são tags semânticas
+        if tag.find(list(semantic_tags)):
+            continue
+
+        text = tag.get_text(strip=True)
+        if text and 30 < len(text) < 500 and text not in seen:
+            seen.add(text)
+            texts.append(text)
+
+    return texts[:15]  # Limitar para não poluir
+
+
+def _extract_ctas(soup: BeautifulSoup) -> list[str]:
+    """Extrai textos de botões e links que parecem ser CTAs."""
+    ctas = []
+
+    # Botões
+    for btn in soup.find_all("button"):
+        text = btn.get_text(strip=True)
+        if text and len(text) < 80:
+            ctas.append(text)
+
+    # Inputs do tipo submit
+    for inp in soup.find_all("input", attrs={"type": "submit"}):
+        value = inp.get("value", "").strip()
+        if value:
+            ctas.append(value)
+
+    # Links com classes comuns de CTA ou texto indicativo
+    cta_keywords = [
+        "btn", "button", "cta", "action", "comprar", "contratar",
+        "saiba", "agendar", "solicitar", "falar", "whatsapp",
+        "contato", "orcamento", "orçamento", "consulta", "agende",
+    ]
+    for a_tag in soup.find_all("a"):
+        classes = " ".join(a_tag.get("class", [])).lower()
+        href = (a_tag.get("href") or "").lower()
+        text = a_tag.get_text(strip=True)
+        if text and len(text) < 80:
+            if any(kw in classes for kw in cta_keywords):
+                ctas.append(text)
+            elif any(kw in text.lower() for kw in cta_keywords):
+                ctas.append(text)
+            elif "whatsapp" in href or "wa.me" in href:
+                ctas.append(text)
+
+    # Remover duplicados mantendo ordem
+    seen = set()
+    unique_ctas = []
+    for cta in ctas:
+        if cta not in seen:
+            seen.add(cta)
+            unique_ctas.append(cta)
+
+    return unique_ctas
+
+
+def _build_full_text(
+    title: str,
+    meta_description: str,
+    h1: list[str],
+    h2: list[str],
+    h3: list[str],
+    paragraphs: list[str],
+    list_items: list[str],
+    extra_texts: list[str],
+    ctas: list[str],
+) -> str:
+    """Monta um texto completo e estruturado da LP para envio à IA."""
+    parts = []
+
+    if title:
+        parts.append(f"TÍTULO DA PÁGINA: {title}")
+    if meta_description:
+        parts.append(f"META DESCRIPTION: {meta_description}")
+
+    if h1:
+        parts.append("TÍTULOS PRINCIPAIS (H1):")
+        parts.extend(f"  - {h}" for h in h1)
+
+    if h2:
+        parts.append("SUBTÍTULOS (H2):")
+        parts.extend(f"  - {h}" for h in h2)
+
+    if h3:
+        parts.append("SUBTÍTULOS (H3):")
+        parts.extend(f"  - {h}" for h in h3)
+
+    if paragraphs:
+        parts.append("TEXTOS PRINCIPAIS:")
+        parts.extend(f"  {p}" for p in paragraphs[:25])
+
+    if list_items:
+        parts.append("ITENS DE LISTA / BENEFÍCIOS:")
+        parts.extend(f"  - {li}" for li in list_items[:15])
+
+    if extra_texts:
+        parts.append("OUTROS TEXTOS VISÍVEIS:")
+        parts.extend(f"  {t}" for t in extra_texts[:10])
+
+    if ctas:
+        parts.append("CHAMADAS PARA AÇÃO (CTAs):")
+        parts.extend(f"  - {c}" for c in ctas)
+
+    return "\n".join(parts)