Έξυπνες αναζητήσεις
Το googling είναι μια από τις πιο σημαντικές δεξιότητες για κάθε προγραμματιστή. Ας δούμε πώς κάνουμε εξειδικευμ...
Το googling είναι μια από τις πιο σημαντικές δεξιότητες για κάθε προγραμματιστή. Ας δούμε πώς κάνουμε εξειδικευμ...
Στη JavaScript, οι χρονικές σημάνσεις συνήθως συσχετίζονται με την ώρα Unix. Και υπάρχουν διαφορετικές μέθοδοι για τ...
Αλληλεπιδρούμε πολύ με το HTTP και το HTTPS στην καθημερινή μας ζωή, αλλά πολλοί από εμάς δεν γνωρί...
An absolute path refers to defining the full exact file path, for example, D:\http\project\lib\file.php. While a relative path is based on the current working directory, where the script is located. ...
What Is a PHP Interface? A PHP interface defines a contract which a class must fulfill. If a PHP class is a blueprint for objects, an interface is a blueprint for classes. Any class implementing a ...
@Ο πιο κάτω κώδικας μας δίνει τη δυνατότητα να αποθηκεύσουμε όλα τα links που έχει μια ιστοσελίδα. Χρησιμοποιεί τη βιβλιοθήκη bs4 (BeautifulSoup). Αν δεν την έχετε εγκατεστημένη:
pip install bs4
Αφού κάνει parsing τον κώδικα, αποθηκεύει τα links σε αρχείο κειμένου (myLinks.txt), αντί να τα εμφανίζει στην οθόνη. Μπορείτε να αλλάξετε την παράμετρο 'a' σε 'w', ώστε το αρχείο να δημιουργείται κάθε φορά με τα links της νέας ιστοσελίδας. Εξ' ορισμού η παράμετρος είναι 'a', δηλαδή κάθε φορά που τρέχουμε το script, τα δεδομένα προστίθενται στο αρχείο κειμένου.
import requests as rq
from bs4 import BeautifulSoup
url = input("Enter Link: ")
if ("https" or "http") in url:
data = rq.get(url)
else:
data = rq.get("https://" + url)
soup = BeautifulSoup(data.text, "html.parser")
links = []
for link in soup.find_all("a"):
links.append(link.get("href"))
with open("myLinks.txt", 'a') as saved:
print(links[:10], file=saved)
Εγγραφείτε για να βλέπετε τα εξειδικευμένα άρθρα.