בירור | שמירת סיפור מהאינטרנט לקובץ pdf
-
@הייתי-שמח-להבין הנה קוד שיעשה במקומך את כל העבודה:
from base64 import b64decode import os import time from selenium import webdriver from selenium.webdriver.chrome.service import Service from webdriver_manager.chrome import ChromeDriverManager from selenium.webdriver.common.print_page_options import PrintOptions, Orientation # some tweaks to bypass bot detection options = webdriver.ChromeOptions() options.add_experimental_option("excludeSwitches", ["enable-automation"]) options.add_experimental_option('useAutomationExtension', False) options.add_argument("--disable-blink-features=AutomationControlled") options.page_load_strategy = 'normal' options.headless = True # initialise webdriver driver = webdriver.Chrome(service=Service(ChromeDriverManager().install()),options=options) #driver = webdriver.Chr for i in range(1,123): driver.get("https://online.fliphtml5.com/nejge/kkyl/#p="+str(i)) time.sleep(1) #save the page to disk printOptions = PrintOptions() printOptions.orientation="landscape" open(str(i)+".pdf", "wb").write(b64decode(driver.print_page(printOptions))) # after scraping all pages, merge them with pypdf from pypdf import PdfMerger files = os.listdir() pdfs = [s for s in files if '.pdf' in s] #sorting the file names by number - not alphabethic def forSorting(s)->int: s=s.split('.')[0] return int(s) pdfs.sort(key=forSorting) merger = PdfMerger() for pdf in pdfs: merger.append(pdf) merger.write("result.pdf") merger.close()
והוא אכן עשה את העבודה, הנה התוצאה:
result.pdf
שים לב, @משה-שמחה
אז נעים להכיר את סלניום, מלך הבוטים... -
@משה-שמחה כתב בבירור | שמירת סיפור מהאינטרנט לקובץ pdf:
יש כאן סיפור בהמשכים יש דרך לשמור את כל הסיפור כקובץ pdf לקריאה אופליין?
סגנון התצוגה שם מוכר לי, למרות שאיני יודע את שמו, עד כמה שידוע לי זה לא ניתן לשמירה והורדה, זה סוג של "תצוגה מוגנת".
-
@הייתי-שמח-להבין כתב בבירור | שמירת סיפור מהאינטרנט לקובץ pdf:
@106 אין שם אופציה להדפיס, אולי צילום מסך.
צילום מסך פלוס ocr
-
@הייתי-שמח-להבין כתב בבירור | שמירת סיפור מהאינטרנט לקובץ pdf:
@אברהם-א נכון, אבל מדובר על 190 עמודים לא נראה לי שזה מה ש-@משה-שמחה מחפש.
צודק,
אולי לחפור במקור אבל אני לא יודע איך עושים את זה, -
@הייתי-שמח-להבין כתב בבירור | שמירת סיפור מהאינטרנט לקובץ pdf:
אין שם אופציה להדפיס, אולי צילום מסך.
אין דף אינטרנט שאי אפשר להדפיס, באפשרויות בלחצן ימני של העכבר או בשלש נקודות בצד שמאל למעלה יש אפשרות הדפסה ואז אפשר על pdf
-
@כ-ק כתב בבירור | שמירת סיפור מהאינטרנט לקובץ pdf:
@הייתי-שמח-להבין כתב בבירור | שמירת סיפור מהאינטרנט לקובץ pdf:
אין שם אופציה להדפיס, אולי צילום מסך.
אין דף אינטרנט שאי אפשר להדפיס, באפשרויות בלחצן ימני של העכבר או בשלש נקודות בצד שמאל למעלה יש אפשרות הדפסה ואז אפשר על pdf
אתה ממש צודק, פרח מזכרוני, אבל בכל זאת זה לעבור עמוד עמוד.
-
@הייתי-שמח-להבין אם זה שרשור אחד גדול אז זה נשמר הכל ביחד אם צריך לעבור בין דפי אינטרנט אז אי אפשר
-
-
@דורש-טוב כתב בבירור | שמירת סיפור מהאינטרנט לקובץ pdf:
@הייתי-שמח-להבין אפשר לשים כוכביות
https://drive.google.com/fi*****le/d/1u23uo_RnL6VsFV31O8kOJW7nILxsnz76/view?usp=drive_linkמה הקטע?
קובץ משותף ללא הגבלה נחסם בנטפרי אוטומטית, עד שאתה מבקש לשחרר. -
@הייתי-שמח-להבין מה נראה לך שאמרתי לך לשים בשביל היופי?
זה עושה שזה לא ייחסם כמנהג הפורום מקדמת דנא -
@הייתי-שמח-להבין כנראה שלא
לדוגמא
https://drive.google.com/fil*******e/d/15WwvyapStG-o3F7HCQnVxxFX_kxoC8sz/view?usp=sharingגם יש לדייק בלשונם 'קובץ שהתפרסם לציבור'
-
@הייתי-שמח-להבין זה קובץ שאני העליתי ומשום מה הם חושבים שזה וירוס אז חסמו אותו. בהתחלה זה היה פתוח
הקובץ שלך נחסם עכשיו כי השארת את הקישור בלי כוכביות
תצטרך אם אתה רוצה להעלות אותו מחדש בשביל ליצור קישור חדש או שאולי יש דרך אחרת -
@דורש-טוב כתב בבירור | שמירת סיפור מהאינטרנט לקובץ pdf:
@הייתי-שמח-להבין
... הקובץ שלך נחסם עכשיו כי השארת את הקישור בלי כוכביות
תצטרך אם אתה רוצה להעלות אותו מחדש בשביל ליצור קישור חדש או שאולי יש דרך אחרתצודק השניה אחזתי את זה, כבר קישור לקובץ חדש.