Как да създадете бот и да автоматизирате ежедневната си работа

Повечето работни места имат повтарящи се задачи, които можете да автоматизирате, което освобождава част от ценното ви време. Това прави автоматизацията ключово умение за придобиване.

Малка група опитни инженери по автоматизация и експерти по домейни може да успеят да автоматизират много от най-досадните задачи на цели екипи.

В тази статия ще изследваме основите на автоматизацията на работния процес, използвайки Python - мощен и лесен за научаване език за програмиране. Ще използваме Python, за да напишем лесен и полезен малък скрипт за автоматизация, който ще почисти дадена папка и ще постави всеки файл в съответната папка.

Нашата цел няма да бъде да напишем перфектен код или да създадем идеални архитектури в началото.

Също така няма да изградим нищо „незаконно“. Вместо това ще разгледаме как да създадем скрипт, който автоматично почиства дадена папка и всички нейни файлове.

Съдържание

  1. Области на автоматизация и откъде да започнем
    • Проста автоматизация
    • Публична API автоматизация
    • Обратно инженерство на API
  2. Етични съображения на автоматизацията
  3. Създаване на скрипт за почистване на директория
  4. Пълно ръководство за създаване на ботове и автоматизиране на вашата ежедневна работа

Области на автоматизация и откъде да започнем

Нека започнем с дефинирането на вида автоматизации, които съществуват.

Изкуството на автоматизацията се прилага за повечето сектори. Като за начало помага за задачи като извличане на имейл адреси от куп документи, за да можете да изпратите имейл. Или по-сложни подходи като оптимизиране на работните потоци и процеси в големите корпорации.

Разбира се, преминаването от малки лични скриптове към голяма инфраструктура за автоматизация, която замества действителните хора, включва процес на обучение и усъвършенстване. Така че нека видим откъде можете да започнете пътуването си.

Прости автоматизации

Простите автоматизации позволяват бърза и ясна точка за влизане. Това може да обхваща малки независими процеси като почистване на проекти и преструктуриране на файлове в директориите или части от работен поток като автоматично преоразмеряване на вече запазени файлове.

Публични API автоматизации

Публичните API автоматизации са най-често срещаната форма на автоматизация, тъй като в наши дни можем да получим достъп до повечето функционалности, използвайки HTTP заявки към API. Например, ако искате да автоматизирате поливането на вашата самостоятелно направена интелигентна градина у дома.

За да направите това, искате да проверите времето на текущия ден, за да видите дали трябва да поливате или има дъжд.

Обратно инженерство на API

Автоматизацията, базирана на обратното инженерство на API, е по-често срещана при действителните ботове и раздела „Bot Imposter“ на диаграмата в раздела „Етични съображения“ по-долу.

Чрез обратен инженеринг на API разбираме потребителския поток от приложения. Един пример може да бъде влизането в онлайн браузър игра.

Разбирайки процеса на влизане и удостоверяване, можем да дублираме това поведение със собствен скрипт. След това можем да създадем собствен интерфейс за работа с приложението, въпреки че те не го предоставят сами.

Към какъвто и подход да се стремите, винаги преценете дали е законен или не.

Не искате да си вкарвате неприятности, нали? ?

Етични съображения

Веднъж някой от GitHub се свърза с мен и ми каза това:

„Харесванията и ангажираността са цифрова валута и вие ги обезценявате.“

Това остана в мен и ме накара да поставя под въпрос инструмента, който съм създал точно за тази цел.

Фактът, че тези взаимодействия и ангажираността могат да бъдат автоматизирани и „фалшифицирани“ все повече и повече, води до изкривена и счупена система на социалните медии.

Хората, които произвеждат ценно и добро съдържание, са невидими за другите потребители и рекламни компании, ако не използват ботове и други ангажиращи системи.

Един мой приятел излезе със следната асоциация с „Деветте кръга на ада“ на Данте, където с всяка стъпка по-близо до превръщането си в социален влиятел вие все по-малко осъзнавате колко разбита е цялата тази система.

Искам да споделя това с вас тук, тъй като мисля, че това е изключително точно представяне на това, на което бях свидетел, докато работех активно с Influencers с InstaPy.

Ниво 1: Лимбо - Ако изобщо не ботите

Ниво 2: Флирт - Когато ръчно харесвате и следвате колкото се може повече хора, за да ги накарате да ви последват / харесват вашите публикации

Ниво 3: Конспирация - когато се присъедините към група в Telegram, за да харесате и коментирате 10 снимки, така че следващите 10 души ще харесат и коментират вашата снимка

Ниво 4: Изневяра - Когато използвате евтин виртуален асистент, за да харесвате и следвате от ваше име

Ниво 5: Похот - Когато използвате бот, за да давате харесвания и не получавате обратно харесвания в замяна (но не плащате за това - например разширение за Chrome)

Ниво 6: Promiscuity - Когато използвате бот, за да дадете 50+ харесвания, за да получите 50+ харесвания, но не плащате за това - например разширение за Chrome

Ниво 7: Скупост или екстремна алчност - Когато използвате бот, за да харесате / следвате / коментирате между 200–700 снимки, пренебрегвайки шанса да бъдете забранени

Ниво 8: Проституция - Когато плащате на неизвестна услуга на трета страна, за да се включите в автоматични реципрочни харесвания / следи за вас, но те използват акаунта ви, за да харесат / следят обратно

Ниво 9: Измама / ерес - Когато купувате последователи и харесвания и се опитвате да се продадете на марки като влиятелен човек

Нивото на ботване в социалните медии е толкова широко разпространено, че ако не ботите, ще останете на ниво 1, Limbo , без растеж на последователи и ниска ангажираност спрямо вашите връстници.

В икономическата теория това е известно като дилема на затворник и игра с нулева сума . Ако аз не бот, а вие бот, вие печелите. Ако не бот и аз бот, аз печеля. Ако никой не се ботира, всички печелят. Но тъй като няма стимул за всички да не ботват, всички се ботят, така че никой не печели.

Имайте предвид това и никога не забравяйте последиците от целия този инструмент в социалните медии.

Искаме да избягваме да се занимаваме с етични последици и все пак да работим по проект за автоматизация тук. Ето защо ще създадем прост скрипт за почистване на директории, който ви помага да организирате разхвърляните си папки.

Създаване на скрипт за почистване на директория

Сега искаме да разгледаме доста прост скрипт. Той автоматично почиства дадена директория, като премества тези файлове в съответните папки въз основа на разширението на файла.

И така, всичко, което искаме да направим, е следното:

Настройване на анализатора на аргументи

Since we are working with operating system functionality like moving files, we need to import the os library. In addition to that, we want to give the user some control over what folder is cleaned up. We will use the argparse library for this.

import os import argparse

After importing the two libraries, let's first set up the argument parser. Make sure to give a description and a help text to each added argument to give valuable help to the user when they type --help.

Our argument will be named --path. The double dashes in front of the name tell the library that this is an optional argument. By default we want to use the current directory, so set the default value to be ".".

parser = argparse.ArgumentParser( description="Clean up directory and put files into according folders." ) parser.add_argument( "--path", type=str, default=".", help="Directory path of the to be cleaned directory", ) # parse the arguments given by the user and extract the path args = parser.parse_args() path = args.path print(f"Cleaning up directory {path}")

This already finishes the argument parsing section – it's quite simple and readable, right?

Let's execute our script and check for errors.

python directory_clean.py --path ./test => Cleaning up directory ./test

Once executed, we can see the directory name being printed to the console, perfect.

Let's now use the os library to get the files of the given path.

Getting a list of files from the folder

By using the os.listdir(path) method and providing it a valid path, we get a list of all the files and folders inside of that directory.

After listing all elements in the folder, we want to differentiate between files and folders since we don't want to clean up the folders, only the files.

In this case, we use a Python list comprehension to iterate through all the elements and put them into the new lists if they meet the given requirement of being a file or folder.

# get all files from given directory dir_content = os.listdir(path) # create a relative path from the path to the file and the document name path_dir_content = [os.path.join(path, doc) for doc in dir_content] # filter our directory content into a documents and folders list docs = [doc for doc in path_dir_content if os.path.isfile(doc)] folders = [folder for folder in path_dir_content if os.path.isdir(folder)] # counter to keep track of amount of moved files # and list of already created folders to avoid multiple creations moved = 0 created_folders = [] print(f"Cleaning up {len(docs)} of {len(dir_content)} elements.")

As always, let's make sure that our users get feedback. So add a print statement that gives the user an indication about how many files will be moved.

python directory_clean.py --path ./test => Cleaning up directory ./test => Cleaning up 60 of 60 elements.

After re-executing the python script, we can now see that the /test folder I created contains 60 files that will be moved.

Creating a folder for every file extension

The next and more important step now is to create the folder for each of the file extensions. We want to do this by going through all of our filtered files and if they have an extension for which there is no folder already, create one.

The os library helps us with more nice functionality like the splitting of the filetype and path of a given document, extracting the path itself and name of the document.  

# go through all files and move them into according folders for doc in docs: # separte name from file extension full_doc_path, filetype = os.path.splitext(doc) doc_path = os.path.dirname(full_doc_path) doc_name = os.path.basename(full_doc_path) print(filetype) print(full_doc_path) print(doc_path) print(doc_name) break

The break statement at the end of the code above makes sure that our terminal does not get spammed if our directory contains dozens of files.

Once we've set this up, let's execute our script to see an output similar to this:

python directory_clean.py --path ./test => ... => .pdf => ./test/test17 => ./test => test17

We can now see that the implementation above splits off the filetype and then extracts the parts from the full path.

Since we have the filetype now, we can check if a folder with the name of this type already exists.

Before we do that, we want to make sure to skip a few files. If we use the current directory "." as the path, we need to avoid moving the python script itself. A simple if condition takes care of that.

In addition to that, we don't want to move Hidden Files, so let's also include all files that start with a dot. The .DS_Store file on macOS is an example of a hidden file.

 # skip this file when it is in the directory if doc_name == "directory_clean" or doc_name.startswith('.'): continue # get the subfolder name and create folder if not exist subfolder_path = os.path.join(path, filetype[1:].lower()) if subfolder_path not in folders: # create the folder

Once we've taken care of the python script and hidden files, we can now move on to creating the folders on the system.

In addition to our check, if the folder already was there when we read the content of the directory, in the beginning, we need a way to track the folders we've already created. That was the reason we declared the created_folders = [] list. It will serve as the memory to track the names of folders.

To create a new folder, the os library provides a method called os.mkdir(folder_path) that takes a path and creates a folder with the given name there.

This method may throw an exception, telling us that the folder already exists. So let's also make sure to catch that error.

if subfolder_path not in folders and subfolder_path not in created_folders: try: os.mkdir(subfolder_path) created_folders.append(subfolder_path) print(f"Folder {subfolder_path} created.") except FileExistsError as err: print(f"Folder already exists at {subfolder_path}... {err}")

After setting up the folder creation, let's re-execute our script.

python directory_clean.py --path ./test => ... => Folder ./test/pdf created.

On the first run of execution, we can see a list of logs telling us that the folders with the given types of file extensions have been created.

Moving each file into the right subfolder

The last step now is to actually move the files into their new parent folders.

An important thing to understand when working with os operations is that sometimes operations can not be undone. This is, for example, the case with deletion. So it makes sense to first only log out the behavior our script would achieve if we execute it.

This is why the os.rename(...) method has been commented here.

# get the new folder path and move the file new_doc_path = os.path.join(subfolder_path, doc_name) + filetype # os.rename(doc, new_doc_path) moved += 1 print(f"Moved file {doc} to {new_doc_path}")

After executing our script and seeing the correct logging, we can now remove the comment hash before our os.rename() method and give it a final go.

# get the new folder path and move the file new_doc_path = os.path.join(subfolder_path, doc_name) + filetype os.rename(doc, new_doc_path) moved += 1 print(f"Moved file {doc} to {new_doc_path}") print(f"Renamed {moved} of {len(docs)} files.")
python directory_clean.py --path ./test => ... => Moved file ./test/test17.pdf to ./test/pdf/test17.pdf => ... => Renamed 60 of 60 files.

This final execution will now move all the files into their appropriate folders and our directory will be nicely cleaned up without the need for manual actions.

In the next step, we could now use the script we created above and, for example, schedule it to execute every Monday to clean up our Downloads folder for more structure.

That is exactly what we are creating as a follow-up inside of our Bot Creation and Workflow Automation Udemy course.

A Complete Guide to Bot Creation and Automating Your Everyday Work

Felix and I built an online video course to teach you how to create your own bots based on what we've learned building InstaPy and his Travian-Bot. In fact, he was even forced to take down since it was too effective.

Join right in and start learning.

If you have any questions or feedback, feel free to reach out to us on Twitter or directly in the discussion section of the course ?