Học về hàm preg_replace trong php

Học về hàm preg_replace trong php là vấn đề được nhiều lập trình viên quan tâm, bởi những kiến thức trên trường lớp là không đủ, vì vậy bài Học về hàm preg_replace trong php sẽ chia sẻ tới bạn nhiều thông tin hữu ích

Mọi người vẫn hỏi tôi về việc học lập trình nói chung và PHP nói riêng có cần năng khiếu hay quá khó để tiếp cận hay không. Thì tôi có thể trả lời rằng, học lập trình cũng như việc bạn học tiếng Anh hay bất kỳ một ngôn ngữ khác, bởi lập trình...là ngôn ngữ của máy tính, để máy tính đọc và máy tính thực hiện theo yêu cầu của mình, bạn thích là học được.

Trong bài này chúng ta tìm hiểu một hàm khá giống với hàm str_replace đó là hàm preg_replace.

1. Hàm preg_replace trong PHP

Hàm preg_replace dùng để replace một chuỗi nào đó khớp với đoạn Regular Expression truyền vào. Hàm này có chức năng tương tự như str_replace nhưng có sự khác biệt là một bên dùng regex một bên không dùng.

Cú pháp: preg_replace ( $pattern, $replacement, $subject)

Trong đó:

  • $partern: là chuỗi Regular Expression
  • $replacement: là chuỗi replace thành
  • $subject: là string muốn duyệt và replace

Kết quả trả về của hàm preg_replace là chuỗi đã được replace.

2. Ví dụ hàm preg_relace trong PHP

Ví dụ 1: Replace chuỗi hi thành chuỗi hello trong chuỗi hi everybody, hi there

$partern = '/hi/';
$subject = 'hi everybody, hi there';
$replacement = 'hello';
echo preg_replace($partern, $replacement, $subject); 

Kết quả xuất ra màn hình là chuỗi hello everybody, hello there đã được replace

Ví dụ 2: Xóa thẻ h1 trong chuỗi <h1>Welcome to Hoidapcode.com</h1>

Nhận xét: Ta thấy để xóa thẻ h1 thì sẽ phải replace cho cả thẻ đóng </h1> và thẻ mở <h1> thành ký tự trống ''. Ta sẽ có 2 cách xử lý cho bài này.

Cách 1: Dùng toán tử OR trong Regular Expression, tức là sẽ kiểm tra nếu là thẻ đóng hoặc thẻ mở thì sẽ bị replace thành ký tự trống. Chuỗi regex sẽ như sau $partern = '/(<h1>)|(<\/h1>)/'. Tôi đã dùng dấu mở và đóng () để gộp 2 nhóm thẻ mở và thẻ đóng lại, luôn luôn làm như vậy nha các bạn.

$partern = '/(<h1>)|(<\/h1>)/';
$subject = '<h1>Welcome to hoidapcode.com</h1>';
$replacement = '';
echo preg_replace($partern, $replacement, $subject); 

Các bạn chạy lên và dùng firebug soi sẽ thấy mất thẻ h1.

Cách 2: Dùng toán tử kiểm tra có hoặc không đó là dấu ?. Bạn quay lại bài trước để xem các ví dụ và cách dùng dấu này nhé.

Các bạn thấy thẻ mở <h1> và thẻ đóng </h1> chỉ khác nhau ở chỗ dấu /. Như vậy chuỗi partern sẽ như sau $partern = '/(<\/?h1>)/'. Vì dấu / là ký tự đặc biệt trong Regular Expression nên tôi đã thêm một dấu \ để đặt trước nó. Những điều này tôi đã nói ở bài trước rồi nên bạn quay lại xem nhé. Dấu ? là có ý nghĩa có hoặc không có ký tự, tức là <h1> hoặc </h1>

$partern = '/(<\/?h1>)/';
$subject = '<h1>Welcome to hoidapcode.com</h1>';
$replacement = '';
echo preg_replace($partern, $replacement, $subject); 

Chạy lên kết quả tương đương như cách 1.

Ví dụ 3: Dùng Regular Expression xóa tất cả những thẻ html (h1, h2, h3, h4, h5) của một đoạn text

Nếu không dùng hàm preg_replace kết hợp với Regular Expression thì trong php có cung cấp 1 hàm để xử lý vấn đề này, đó là hàm strip_tags. Nhưng trong đề bài yêu cầu dùng Regular Expresision nên phải làm vậy thôi.

Ý tưởng: Ở ví dụ 2 ta đã xóa được một thẻ h1, như vậy muốn xóa các thẻ khác thì chỉ cần copy và thay đổi giá trị thẻ là được, cách làm như sau:

$subject = '<h1>This is h1</h1><h2>This is h2</h2><h3>This is h3</h3><h4>This is h4 </div><h5> This is h5 </h5>';
// H1
$subject = preg_replace('/<\/?h1>/', '', $subject);
// H2
$subject = preg_replace('/<\/?h2>/', '', $subject);
// H3
$subject = preg_replace('/<\/?h3>/', '', $subject);
// H4
$subject = preg_replace('/<\/?h4>/', '', $subject);
// H5
$subject = preg_replace('/<\/?h5>/', '', $subject);
 
echo $subject; 

Nhưng các bạn thấy liệu có hay không? có cách này để đưa vào một partern mà xử lý hết các thẻ luôn hay không? Câu trả lời là có nhé. Bạn kết hợp ví dụ 1 và ví dụ 2 lại sẽ có được chuỗi partern mong muốn. Các bạn xem bài giải sau:

$subject = '<h1>This is h1</h1><h2>This is h2</h2><h3>This is h3</h3><h4>This is h4 </div><h5> This is h5 </h5>';
echo preg_replace('/(<\/?h1>)|(<\/?h2>)|(<\/?h3>)|(<\/?h4>)|(<\/?h5>)/', '', $subject); 

Rất gọn đúng không nào, các bạn tham khảo thêm một cách giải nữa:

$subject = '<h1>This is h1</h1><h2>This is h2</h2><h3>This is h3</h3><h4>This is h4 </div><h5> This is h5 </h5>';
echo preg_replace('/<\/?h(1|2|3|4|5)>/', '', $subject);

Cách này tôi dùng toán tử OR cho các số 1 hoặc 2 hoặc 3 hoặc 4 hoặc 5. Đây là cách gọn và tối ưu nhất đúng không nào.

3. Lời kết

Qua 3 ví dụ trên chắc hẳn bạn đã biết các sử dụng hàm preg_replace trong php kết hợp với Regular Expression rồi nhỉ. Có rất nhiều bài toán khác nhau và ứng dụng khác nhau nên không thể quy ra một công thức chung được, các bạn cố gắng nắm vững các biểu thức Regular Expression để kết hợp là ok.

Hy vọng với bài viết về Học về hàm preg_replace trong php đã giải đáp giúp bạn phần nào về kiến thức lập trình PHP. Như tôi đã nói, ngôn ngữ lập trình không quan trọng bằng tư duy giải thuật, tư duy logic để giải quyết vấn đề.

Với những năm trước đây, lập trình viên là một cái nghề khó và kén chọn người học, đồng nghĩa với việc thu nhập hàng tháng của các lập trình viên luôn cao. Còn những năm gần đây, thì lập trình là môn học phổ thông, và ai cũng nên học một ngôn ngữ lập trình nào đó.

Nếu bạn còn bất kỳ câu hỏi nào trong việc học lập trình online, hãy gửi yêu cầu cho tôi qua email hoidapcode.com@gmail.com hoặc để lại comment bên dưới, tôi sẽ giải đáp trong vòng 24 giờ!

Blog hoidapcode.com là blog được tổng hợp tự động các bài học, thông tin về lập trình trên mạng internet. Nếu bạn có ý kiến hoặc đóng góp về bài viết này, hãy liên hệ với tôi!