1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
|
import re
def tag_gen(input_str):
input_str = input_str.lower()
input_str = re.sub(r'aii', '', input_str)
input_str = re.sub(r'20\d{2}-\d{2}', '', input_str)
input_str = re.sub(r'[pb]\d+', '', input_str)
input_str = re.sub(r'\d', '', input_str)
input_str = re.sub(r'blok', '', input_str)
input_str = re.sub(r'programmeren c', 'programmeren', input_str)
input_str = re.sub(r'stylofoon', '', input_str)
input_str = re.sub(r'[-]', '', input_str)
input_str = re.sub(r'\s+', ' ', input_str)
return input_str.strip()
def title_filter(input_str):
input_str = input_str.lower()
input_str = re.sub(r'- due', '', input_str)
input_str = re.sub(r'- available', '', input_str)
input_str = re.sub(r'- availability ends', '', input_str)
return input_str.strip()
|