Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

[SCRAPER] - Cannot parse recipe from https://akispetretzikis.com/ using URL #4706

Open
3 tasks done
vpant opened this issue Dec 10, 2024 · 1 comment
Open
3 tasks done
Labels
bug Something isn't working scraper triage

Comments

@vpant
Copy link

vpant commented Dec 10, 2024

First Check

  • I used the GitHub search to find a similar issue and didn't find it.

  • I have verified that this issue is not related to the underlying library
    hhyrsev/recipe-scrapers by 1) checking
    the debugger and data is returned, 2)
    verifying that there are errors in the log related to application level code, or
    3) verified that the site provides recipe data, or is otherwise supported by
    hhyrsev/recipe-scrapers

  • This issue can be replicated on the demo site (https://demo.mealie.io/)

Please provide 1-5 example URLs that are having errors

https://akispetretzikis.com/recipe/8617/zymarika-me-choirino-ston-fourno

The ld+json can be found within the HTML of the page and importing that is working as expected

<script type="application/ld+json">{"@context":"https://schema.org/","@type":"Recipe","name":"Ζυμαρικά με χοιρινό στον φούρνο","image":["https://akispetretzikis.com/photos/179725/zimarika-me-xoirino-sto-fourno-16-9-24-site.jpg"],"author":{"@type":"Person","name":"Akis Petretzikis"},"datePublished":"2024-11-13T11:16:03.000000Z","description":"Ζυμαρικά με χοιρινό στον φούρνο από τον Άκη Πετρετζίκη. Ξεφύγετε από τις συνηθισμένες μακαρονάδες φτιάχνοντας πλεξούδες με χοιρινό στον φούρνο!","recipeCategory":19,"recipeCuisine":"Greek","recipeYield":"8-10","keywords":["Ζυμαρικά","με","χοιρινό","στον","φούρνο"],"aggregateRating":{"@type":"AggregateRating","ratingValue":5,"ratingCount":5},"nutrition":{"@type":"NutritionInformation","calories":"682 calories"},"recipeInstructions":[{"@type":"HowToStep","text":"Κόβουμε σε μια επιφάνεια κοπής το χοιρινό σε κυβάκια και αφήνουμε στην άκρη.&nbsp;"},{"@type":"HowToStep","text":"Κόβουμε σε μια άλλη επιφάνεια κοπής τα καρότα σε μισοφέγγαρα, το κρεμμύδι και τις πιπεριές ζουλιέν και ψιλοκόβουμε το σκόρδο.&nbsp;"},{"@type":"HowToStep","text":"Τοποθετούμε μια ρηχή κατσαρόλα σε δυνατή φωτιά και αφήνουμε να κάψει.&nbsp;"},{"@type":"HowToStep","text":"Ρίχνουμε το ελαιόλαδο, το χοιρινό, αλάτι και πιπέρι, και σοτάρουμε για 3-4 λεπτά χωρίς να ανακατέψουμε.&nbsp;"},{"@type":"HowToStep","text":"Ανακατεύουμε, προσθέτουμε όλα τα λαχανικά και σοτάρουμε για 10-12 λεπτά μέχρι να πάρουν χρώμα.&nbsp;"},{"@type":"HowToStep","text":"Ρίχνουμε αλάτι, πιπέρι, τη μουστάρδα και το νερό, χαμηλώνουμε τη φωτιά και σιγοβράζουμε για 40 λεπτά.&nbsp;"},{"@type":"HowToStep","text":"Τοποθετούμε μια κατσαρόλα σε δυνατή φωτιά, ρίχνουμε νερό και αφήνουμε να πάρει μια βράση.&nbsp;"},{"@type":"HowToStep","text":"Ρίχνουμε αλάτι και τα ζυμαρικά, και βράζουμε σύμφωνα με τις οδηγίες της συσκευασίας.&nbsp;"},{"@type":"HowToStep","text":"Αποσύρουμε την κατσαρόλα από τη φωτιά, σουρώνουμε τα ζυμαρικά και αφήνουμε στην άκρη να κρυώσουν.&nbsp;"},{"@type":"HowToStep","text":"Προθερμαίνουμε τον φούρνο στους 200&deg;C στον αέρα.&nbsp;&nbsp;"},{"@type":"HowToStep","text":"Μεταφέρουμε τα ζυμαρικά σε ένα πυρίμαχο σκεύος.&nbsp;"},{"@type":"HowToStep","text":"Αποσύρουμε και την κατσαρόλα με το κρέας από τη φωτιά και το ρίχνουμε πάνω από τα ζυμαρικά.&nbsp;"},{"@type":"HowToStep","text":"Προσθέτουμε 250 γρ. από το mix τυριών και την κρέμα γάλακτος.&nbsp;"},{"@type":"HowToStep","text":"Ψιλοκόβουμε τον μαϊντανό, τον ρίχνουμε και αυτόν, και ανακατεύουμε με ένα κουτάλι.&nbsp;"},{"@type":"HowToStep","text":"Ρίχνουμε από πάνω το υπόλοιπο mix τυριών, μεταφέρουμε στον φούρνο και ψήνουμε για 20 λεπτά.&nbsp;"},{"@type":"HowToStep","text":"Βγάζουμε από τον φούρνο και σερβίρουμε.&nbsp;"}],"cookTime":"PT85M","prepTime":"PT25M","recipeIngredient":["700 γρ.  χοιρινό λαιμό","500 γρ.  ζυμαρικά πλεξούδες","2  καρότα","1  κρεμμύδι","1  πράσινη πιπεριά","1  κόκκινη πιπεριά","1 σκ. σκόρδο","1-2 κ.σ. ελαιόλαδο","1 κ.σ. μουστάρδα","500 γρ.  νερό","400 γρ.  mix τυριών","500 γρ.  κρέμα γάλακτος 35%","½ ματσάκι μαϊντανό","  αλάτι","  πιπέρι "],"video":[{"@type":"VideoObject","name":"Ζυμαρικά με χοιρινό στον φούρνο","description":"Ζυμαρικά με χοιρινό στον φούρνο από τον Άκη Πετρετζίκη. Ξεφύγετε από τις συνηθισμένες μακαρονάδες φτιάχνοντας πλεξούδες με χοιρινό στον φούρνο!","thumbnailUrl":["https://img.youtube.com/vi/jGV4otF41I0/0.jpg","https://img.youtube.com/vi/jGV4otF41I0/1.jpg","https://img.youtube.com/vi/jGV4otF41I0/2.jpg"],"contentUrl":"https://www.youtube.com/watch?v=jGV4otF41I0","embedUrl":"https://www.youtube.com/watch?v=jGV4otF41I0","uploadDate":"2024-11-15 17:00:00"}]}</script>

It seems there is also a REST API that provides this information

GET https://akispetretzikis.com/api/v1/recipe/8617?lang=el&version=1.1

Please provide your logs for the Mealie container docker logs <container-id> > mealie.logs

INFO     2024-12-10T18:44:28 - HTTP Request: GET https://akispetretzikis.com/recipe/8617/zymarika-me-choirino-ston-fourno "HTTP/1.1 403 Forbidden"
ERROR    2024-12-10T18:44:28 - Recipe Scraper was unable to extract a recipe from https://akispetretzikis.com/recipe/8617/zymarika-me-choirino-ston-fourno
ERROR    2024-12-10T18:44:28 - Recipe Scraper was unable to extract a recipe from https://akispetretzikis.com/recipe/8617/zymarika-me-choirino-ston-fourno
ERROR    2024-12-10T18:44:28 - Recipe Scraper was unable to extract a recipe from https://akispetretzikis.com/recipe/8617/zymarika-me-choirino-ston-fourno
ERROR    2024-12-10T18:44:28 - Recipe Scraper was unable to extract a recipe from https://akispetretzikis.com/recipe/8617/zymarika-me-choirino-ston-fourno

Deployment

Docker (Linux)

@vpant vpant added bug Something isn't working scraper triage labels Dec 10, 2024
@outlying
Copy link

outlying commented Jan 7, 2025

I think this is same as the one I posted

#4600

It seems that requests from Mealie are not being accepted by some of the websites - I think maybe some sort of the bot protection?

I tried copy-pasting source of the recipe you provided and pasting it to HTML-JSON parser and it worked without any issues

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
bug Something isn't working scraper triage
Projects
None yet
Development

No branches or pull requests

2 participants