⚙️ Setup și Instalare

Cerințe de Sistem

Cerințe Hardware

Aceasta este o soluție hibridă cloud + local - AI-ul rulează în cloud OpenCode, serviciile locale (Chrome, Solr) necesită resurse hardware dedicate.

Componentă Minim Recomandat
RAM 8 GB 16 GB
CPU 2 core 4+ core
Stocare 20 GB liberi 50 GB SSD
AI (Cloud) - -

Detalii Cerințe Hardware:

RAM (Memorie):

Total minim: 8 GB RAM (16 GB recomandat pentru performanță optimă)

CPU:
Stocare:

Recomandare: SSD - îmbunătățește performanța Docker.

⚠️ ATENȚIE: Ai nevoie de minim 8 GB RAM!
  • Chrome + Docker au nevoie de ~3-4 GB RAM
  • Sistemul de operare necesită ~2 GB RAM
  • Cu 8 GB RAM totul va funcționa OK

Confidențialitate și Securitate

Acest proiect folosește o arhitectură hibridă - AI în cloud, date local.

✅ Ce rulează LOCAL pe calculatorul tău:
  • Chrome - cu remote debugging pentru scraping
  • Date de scraping - job-urile sunt stocate local în Solr
  • Credențiale Solr - nu sunt trimise nicăieri
  • Istoric navigare - rămâne în Chrome local
Când folosești OpenCode cu Big Pickle:
Ce necesită internet:
🔒 Confidențialitate:
  • Datele de job-uri rămân în Solr local
  • Navigarea web este locală în Chrome
  • Solr rulează doar pe localhost (port 8983)
  • Chrome DevTools MCP conectează cloud-ul la browser-ul local

0. Instalare Dependențe

Instalează dependențele pentru OpenCode și teste:

OpenCode (se instalează automat de OpenCode CLI):
cd .opencode
npm install
Teste Playwright:
cd tests
npm install
Notă: Folder-ele node_modules sunt generate automat. Nu trebuie incluse în git.

1. Pornire Chrome cu Debugging

Pentru a folosi Chrome DevTools MCP, trebuie să pornești Chrome cu debugging activ pe portul 9222.

Rulează scriptul PowerShell:
powershell -ExecutionPolicy Bypass -File start-chrome.ps1
Important: Acest pas este necesar de fiecare dată când vrei să folosești Chrome DevTools MCP. Chrome trebuie să fie pornit cu flag-ul --remote-debugging-port=9222.
Verifică că Chrome rulează:
curl -s http://127.0.0.1:9222/json

✓ Ar trebui să vezi un răspuns JSON cu informații despre Chrome.

2. Pornire Solr (Optional)

Solr este folosit pentru stocarea și indexarea job-urilor.

Verifică dacă Solr rulează:
docker ps --filter "name=peviitor-solr"
Porneste Solr:
docker start peviitor-solr
Verifică că Solr este accesibil:
curl -s -u solr:SolrRocks "http://localhost:8983/solr/admin/cores"

✓ Ar trebui să vezi un răspuns JSON cu statusul cores-urilor.

Credentiale Solr:
  • Username: solr
  • Password: SolrRocks

3. Setup Teste (Optional)

Pentru a rula testele Playwright:

Instalează dependențele:
cd tests
npm install
Rulează testele:
npx playwright test

4. Folosire OpenCode

După ce ai pornit Chrome, poți folosi comenzile OpenCode:

Scrape o companie:

/scrape EPAM
/scrape ENDAVA
/scrape BENTO

Adaugă o nouă companie:

/add-website EPAM

Actualizează documentația:

/docs-update
/instructions

Login la Solr:

/login-solr

Șterge job din Solr:

/delete-solr url:https://example.com/job
Notă: Fiecare companie are un fișier scraper în webscraper/ (ex: epam.md, endava.md) care conține instrucțiuni specifice pentru extragerea job-urilor și tag-urilor.

Workflow Zilnic

1. Pornește Chrome:
   powershell -ExecutionPolicy Bypass -File start-chrome.ps1

2. Pornește Solr (dacă e oprit):
   docker start peviitor-solr

3. Folosește OpenCode pentru scraping:
   /scrape EPAM        # scrape jobs + tags din EPAM
   /scrape ENDAVA      # scrape jobs + tags din ENDAVA
   /scrape BENTO      # scrape jobs + tags din BENTO

4. Rulează testele pentru verificare:
   cd tests
   npx playwright test

Depanare

Chrome MCP nu funcționează?

Solr nu răspunde?

Testele eșuează?