68. PYTHON (Regex) – Ekstrak Email

python seeklogo.com 10

Bid TIK Polda Kepri

Untuk mendemonstrasikan sebuah contoh penggunaan dari regex, kita buat sebuah script python untuk mengekstrak alamat email dari sebuah string. Misalkan kita memiliki sebuah teks yang mengandung sebuah alamat email :

str = "Please contact admin@zakkymuhammad.com for further information"

Tujuan kita adalah untuk mengekstrak substring “admin@zakkymuhammad.com“. Sebuah alamat email dasar terdiri dari sebuah kata dan mungkin mengandung titik atau strip. Kemudian diikuti oleh @ dan nama domain (nama, sebuah titik dan suffix).

Berikut regex yang akan kita gunakan :

pola = r"([\w.-]+)@([\w.-]+)(.[\w.]+)"

[\w.-]+ mencocokkan satu karakter atau lebih, titik atau strip. Regex di atas menunjukkan bahwa string harus mengandung sebuah kata (dengan titik dan strip), diikuti oleh @, kemudian kata, kemudian titik dan kata lain.

Regex tersebut mengandung 3 group :

  1. Bagian pertama dari email.
  2. Nama domain tanpa suffix.
  3. Domain suffix.

Berikut contohnya :

import re

pola = r"([\w\.-]+)@([\w\.-]+)(\.[\w\.]+)"

kata = "Hubungi admin@zakkymuhammad.com untuk informasi lebih lanjut"

cocok = re.search(pola, kata)
if cocok:
    print(cocok.group())

Dalam kasus string memiliki banyak alamat email, kita dapat menggunakan method re.findall daripada re.search untuk mengekstrak semua alamat email.

Di atas hanya sebuah contoh untuk demontrasi. Regex yang lebih kompleks dibutuhkan untuk memvalidasi email address.


LANJUTKAN BACA MATERI LENGKAP