Arbore Foldere
peviitor_opencode_AI_scrapers/ ├── .github/ # GitHub workflows și templates │ ├── workflows/ │ │ └── pages.yml # GitHub Pages deployment │ ├── ISSUE_TEMPLATE/ │ │ ├── bug-report.md │ │ └── feature-request.md │ └── PULL_REQUEST_TEMPLATE.md ├── docs/ # Documentație HTML │ ├── index.html │ ├── structure.html │ ├── commands.html │ ├── tests.html │ ├── schemas.html │ ├── setup.html │ └── commands/ # Documentație comenzi ├── .opencode/ # Configurare OpenCode │ ├── commands/ # Comenzi personalizate │ │ ├── scrape.md │ │ ├── update-solr.md │ │ ├── delete-solr.md │ │ ├── login-solr.md │ │ ├── add-website.md │ │ ├── docs-update.md │ │ ├── instructions.md │ │ ├── remove-404.md │ │ └── clean-project.md │ └── package.json ├── webscraper/ # Prompt-uri scraping per companie │ ├── websites.md # Lista companii │ ├── epam.md # EPAM │ ├── endava.md # ENDAVA │ ├── bento.md # BENTO │ ├── genpact.md # GENPACT │ ├── orange.md # ORANGE │ ├── farmec.md # FARMEC │ ├── vodafone.md # VODAFONE │ ├── ntt-data.md # NTT DATA │ ├── luxoft.md # LUXOFT │ ├── ddroidd.md # DDROIDD │ ├── levi9.md # LEVI9 │ ├── kaufland.md # KAUFLAND │ ├── hornbach.md # HORNBACH │ ├── carrefour.md # CARREFOUR │ ├── garmin.md # GARMIN │ ├── emerson.md # EMERSON │ ├── bitdefender.md # BITDEFENDER │ ├── stefanini.md # STEFANINI │ ├── assist-software.md # ASSIST SOFTWARE │ ├── codespring.md # CODESPERING │ ├── connatix.md # CONNATIX │ ├── coera.md # COERA │ ├── einfra.md # EINFRA │ ├── eurodealer.md # EURODEALER │ ├── netmatch.md # NETMATCH │ ├── recognos.md # RECOGNOS │ ├── senior-software.md # SENIOR SOFTWARE │ ├── ascom.md # ASCOM │ ├── wayfare.md # WAYFARE │ ├── wolters-kluwer.md # WOLTERS KLUWER │ └── borgdesign.md # BORG DESIGN ├── tests/ # Teste Playwright │ ├── *.test.ts │ ├── README.md │ ├── package.json │ └── playwright.config.ts ├── start-chrome.ps1 # Script pornire Chrome ├── README.md # Documentație proiect ├── SCHEMAS.md # Schema date (Job, Company) ├── AGENTS.md # Documentație pentru AI ├── INSTRUCTIONS.md # Instrucțiuni pentru AI ├── LICENSE # Licență MIT ├── CONTRIBUTING.md # Ghid contribuții ├── CODE_OF_CONDUCT.md # Cod de conduită ├── SECURITY.md # Politică securitate └── opencode.json # Configurare OpenCode
Descriere Foldere și Fișiere
| Fișier/Folder | Descriere |
|---|---|
docs/ |
Documentație HTML pentru înțelegerea proiectului. Include toate informațiile necesare pentru un nou membru. |
docs/commands/ |
Documentație detaliată pentru fiecare comandă OpenCode. |
.opencode/ |
Configurări și comenzi pentru OpenCode AI. Aici sunt definite automatizările. |
.opencode/commands/ |
Comenzi personalizate: /scrape, /update-solr, /login-solr, /delete-solr, /add-website, /docs-update, /instructions, /remove-404, /clean-project |
.github/ |
GitHub workflows și templates pentru issues și PR-uri. |
.github/workflows/ |
GitHub Actions workflows. Conține pages.yml pentru GitHub Pages. |
.github/ISSUE_TEMPLATE/ |
Template-uri pentru bug reports și feature requests. |
webscraper/ |
Prompt-uri de scraping specifice per companie. Conține 27 fișiere .md pentru diferite companii IT în România. |
webscraper/websites.md |
Lista companiilor cu Brand, CUI, Careers URL, și Scraper File asociat. |
tests/ |
Teste Playwright pentru validarea fluxurilor de lucru. Include: login-solr.test.ts, update-solr.test.ts, delete-solr.test.ts |
start-chrome.ps1 |
Script PowerShell pentru pornirea Chrome cu debugging (necesar pentru MCP Chrome DevTools) |
AGENTS.md |
Documentație pentru agenții AI - convenții, comenzi, stil cod |
SCHEMAS.md |
Definite schemele de date pentru Job și Company - câmpuri, tipuri, reguli |
INSTRUCTIONS.md |
Instrucțiuni pentru AI - fluxuri de lucru, comenzi, reguli |
README.md |
Documentație principală a proiectului - introducere, setup, comenzi |
LICENSE |
Licență MIT - permisivă pentru utilizare open source |
CONTRIBUTING.md |
Ghid pentru contribuții - cum să raportezi bug-uri și să faci PR-uri |
CODE_OF_CONDUCT.md |
Codul de conduită al comunității |
SECURITY.md |
Politica de securitate și raportare vulnerabilități |
opencode.json |
Configurare principală OpenCode - MCP servers, context files |
Note
- node_modules/ - Folder generat automat. Pentru a restaura:
cd tests && npm install. Nu trebuie inclus în git. - Fișierele
.mddinwebscraper/conțin instrucțiuni de scraping specifice per companie, incluzând extragerea tag-urilor. - Fișierele temporare (*_jobs.json, *.ps1 nefolosiți) pot fi șterse cu comanda
/clean-project.
Fluxul de Date
websites.md (companii)
↓
/scrape (comandă OpenCode)
↓
Chrome DevTools (scraping)
↓
Date → Job Schema
↓
Solr (stocare)
↓
Teste Playwright (validare)