[PYTHON] 구분 기호를 제거하지 않고 Python split () [duplicate]

2018. 10. 8. 16:31

cnpnote

PYTHON

구분 기호를 제거하지 않고 Python split () [duplicate]

이 코드는 내가 필요로하는 것이 거의 다.

for line in all_lines:
    s = line.split('>')

제외하고 모든 '>'구분 기호가 제거됩니다.

그래서,

<html><head>

변화

['<html','<head']

split () 메서드를 사용하지만 구분 기호를 제거하는 대신 사용할 수 있습니까?

이 결과들로 ..

['<html>','<head>']

해결법

==============================

1.

d = ">"
for line in all_lines:
    s =  [e+d for e in line.split(d) if e]

==============================
2.스플릿을 사용하여 HTML을 구문 분석하는 경우, 고정적이고 안전한 콘텐츠 파일을 목표로 한 원샷 스크립트를 작성하는 경우를 제외하고는 오류를 범할 가능성이 큽니다. HTML 입력을 처리해야한다면 같은 것을 어떻게 처리 할 것입니까?

스플릿을 사용하여 HTML을 구문 분석하는 경우, 고정적이고 안전한 콘텐츠 파일을 목표로 한 원샷 스크립트를 작성하는 경우를 제외하고는 오류를 범할 가능성이 큽니다. HTML 입력을 처리해야한다면 같은 것을 어떻게 처리 할 것입니까?
어쨌든, 다음은 나를 위해 작동합니다 :
```
>>> import re
>>> re.split('(<[^>]*>)', '<body><table><tr><td>')[1::2]
['<body>', '<table>', '<tr>', '<td>']
```

==============================

3.이건 어때:

이건 어때:

import re
s = '<html><head>'
re.findall('[^>]+>', s)

==============================

4.그냥 분할 한 다음 배열 / 목록의 각 요소 (마지막 요소는 제외)에 후행하는 ">"을 추가하십시오.

그냥 분할 한 다음 배열 / 목록의 각 요소 (마지막 요소는 제외)에 후행하는 ">"을 추가하십시오.

from https://stackoverflow.com/questions/7866128/python-split-without-removing-the-delimiter by cc-by-sa and MIT license

'PYTHON' 카테고리의 다른 글

[PYTHON] RGB Int에서 RGB - 파이썬 (0)	2018.10.08
[PYTHON] Python datetime 객체가 잘못된 시간대 오프셋을 표시합니다. (0)	2018.10.08
[PYTHON] pytz를 사용하는 날짜 / 시간대 변환 (0)	2018.10.08
[PYTHON] JDBC로 술어 푸시 다운 작업을 유발합니까? (0)	2018.10.08
[PYTHON] 클래스 변수는 파이썬의 모든 인스턴스에서 공유됩니까? [복제] (0)	2018.10.08

,

티스토리툴바