§ ×p( 7‡ãóV—dZddlZddlZddlmZdgZejd¦«Zejd¦«Zejd¦«Z ejd¦«Z ejd ¦«Zejd ¦«Zejd¦«Z ejd¦«Zejd ¦«Zejd¦«Zejdej¦«Zejdej¦«Zejdej¦«Zejd¦«Zejd¦«ZGd„dej¦«ZdS)zA parser for HTML and XHTML.éN)ÚunescapeÚ HTMLParserz[&<]z &[a-zA-Z#]z%&([a-zA-Z][-.a-zA-Z0-9]*)[^a-zA-Z0-9]z)&#(?:[0-9]+|[xX][0-9a-fA-F]+)[^0-9a-fA-F]z <[a-zA-Z]z z--!?>z-?>z0([a-zA-Z][^\t\n\r\f />]*)(?:[\t\n\r\f ]|/(?!>))*a{ ( (?<=['"\t\n\r\f /])[^\t\n\r\f />][^\t\n\r\f /=>]* # attribute name ) ([\t\n\r\f ]*=[\t\n\r\f ]* # value indicator ('[^']*' # LITA-enclosed value |"[^"]*" # LIT-enclosed value |(?!['"])[^>\t\n\r\f ]* # bare value ) )? (?:[\t\n\r\f ]|/(?!>))* # possibly followed by a space a [a-zA-Z][^\t\n\r\f />]* # tag name [\t\n\r\f /]* # optional whitespace before attribute name (?:(?<=['"\t\n\r\f /])[^\t\n\r\f />][^\t\n\r\f /=>]* # attribute name (?:[\t\n\r\f ]*=[\t\n\r\f ]* # value indicator (?:'[^']*' # LITA-enclosed value |"[^"]*" # LIT-enclosed value |(?!['"])[^>\t\n\r\f ]* # bare value ) )? [\t\n\r\f /]* # possibly followed by a space )* >? aF <[a-zA-Z][^\t\n\r\f />\x00]* # tag name (?:[\s/]* # optional whitespace before attribute name (?:(?<=['"\s/])[^\s/>][^\s/=>]* # attribute name (?:\s*=+\s* # value indicator (?:'[^']*' # LITA-enclosed value |"[^"]*" # LIT-enclosed value |(?!['"])[^>\s]* # bare value ) \s* # possibly followed by a space )?(?:\s|/(?!>))* )* )? \s* # trailing whitespace z#cóÎ—eZdZdZdZdZdddœd„Zd„Zd „Zd „Z dZ d„Zdd œd„Zd„Z d$d„Zd„Zd„Zd$d„Zd%d„Zd„Zd„Zd„Zd„Zd„Zd„Zd„Zd„Zd„Zd„Zd „Zd!„Zd"„Zd#„Z dS)&raEFind tags and other markup and call handler functions. Usage: p = HTMLParser() p.feed(data) ... p.close() Start tags are handled by calling self.handle_starttag() or self.handle_startendtag(); end tags by self.handle_endtag(). The data between tags is passed from the parser to the derived class by calling self.handle_data() with the data as argument (the data may be split up in arbitrary chunks). If convert_charrefs is True the character references are converted automatically to the corresponding Unicode character (and self.handle_data() is no longer split in chunks), otherwise they are passed by calling self.handle_entityref() or self.handle_charref() with the string containing respectively the named or numeric reference as the argument. )ÚscriptÚstyleÚxmpÚiframeÚnoembedÚnoframes)ÚtextareaÚtitleTF)Úconvert_charrefsÚ scriptingcóJ—||_||_| ¦«dS)azInitialize and reset this instance. If convert_charrefs is true (the default), all character references are automatically converted to the corresponding Unicode characters. If *scripting* is false (the default), the content of the ``noscript`` element is parsed normally; if it's true, it's returned as is without being parsed. N)rrÚreset)Úselfrrs ú2/opt/alt/python311/lib64/python3.11/html/parser.pyÚ__init__zHTMLParser.__init__vs$€ð!1ˆÔØ"ˆŒØ Š ‰Œˆˆˆócó¢—d|_d|_t|_d|_d|_d|_tj |¦«dS)z1Reset this instance. Loses all unprocessed data.Úz???NT) ÚrawdataÚlasttagÚinteresting_normalÚinterestingÚ cdata_elemÚ_support_cdataÚ _escapableÚ_markupbaseÚ ParserBaser©rs rrzHTMLParser.reset„sK€àˆŒØˆŒÝ-ˆÔØˆŒØ"ˆÔØˆŒÝÔ×$Ò$ TÑ*Ô*Ð*Ð*Ð*rcóN—|j|z|_| d¦«dS)z‘Feed data to the parser. Call this as often as you want, with as little or as much text as you want (may include '\n'). rN)rÚgoahead©rÚdatas rÚfeedzHTMLParser.feedŽs%€ð”| dÑ*ˆŒØŠQ‰Œˆˆˆrcó0—| d¦«dS)zHandle any buffered data.éN)r$r"s rÚclosezHTMLParser.close—s€àŠQ‰ŒˆˆˆrNcó—|jS)z)Return full source of start tag: '<...>'.)Ú_HTMLParser__starttag_textr"s rÚget_starttag_textzHTMLParser.get_starttag_texts€àÔ#Ð#r©Ú escapablecóŒ—| ¦«|_||_|jdkrtjd¦«|_dS|rB|js;tjd|jztjtjz¦«|_dStjd|jztjtjz¦«|_dS)NÚ plaintextz\Zz&|])z])) ÚlowerrrÚreÚcompilerrÚ IGNORECASEÚASCII)rÚelemr/s rÚset_cdata_modezHTMLParser.set_cdata_mode¡s·€ØŸ*š*™,œ,ˆŒØ#ˆŒØŒ?˜kÒ)Ð)Ý!œz¨%Ñ0Ô0ˆDÔÐÐØ ð B˜tÔ4ð BÝ!œzÐ*DÀtÄÑ*VÝ*,¬-½¼Ñ*@ñ Bô BˆDÔÐÐõ "œzÐ*BÀTÄ_Ñ*TÝ*,¬-½¼Ñ*@ñ Bô BˆDÔÐÐrcó:—t|_d|_d|_dS)NT)rrrrr"s rÚclear_cdata_modezHTMLParser.clear_cdata_modes€Ý-ˆÔØˆŒØˆŒˆˆrcó—||_dS)aEnable or disable support of the CDATA sections. If enabled, "<[CDATA[" starts a CDATA section which ends with "]]>". If disabled, "<[CDATA[" starts a bogus comments which ends with ">". This method is not called by default. Its purpose is to be called in custom handle_starttag() and handle_endtag() methods, with value that depends on the adjusted current node. See https://html.spec.whatwg.org/multipage/parsing.html#markup-declaration-open-state for details. N)r)rÚflags rÚ_set_support_cdatazHTMLParser._set_support_cdata²s€ð#ˆÔÐÐrcóÜ —|j}d}t|¦«}||krI|jr}|jsv| d|¦«}|dkrY| dt ||dz ¦«¦«}|dkr*tjd¦« ||¦«snÈ|}n=|j ||¦«}|r| ¦«}n|jrnŠ|}||krV|jr2|jr+| t|||…¦«¦«n| |||…¦«| ||¦«}||krn|j}|d|¦«rÐt" ||¦«r| |¦«} n°|d|¦«r| |¦«} nŽ|d|¦«r| |¦«} nl|d|¦«r| |¦«} nJ|d |¦«r| |¦«} n(|d z|ks|r| d¦«|d z} nn| dkrÐ|snt" ||¦«rn|d|¦«r_|dz|kr| d¦«nt0 ||¦«rnd| ||dzd…¦«nB|d|¦«rU|}dD]/} | | |d z¦«r|t| ¦«z}nŒ0| ||d z|…¦«ná|d|¦«r(|jr!| ||dzd…¦«n|||dz… ¦«dkr!| ||dzd…¦«ni|d |¦«r!| ||dzd…¦«n<|d|¦«r!| ||dzd…¦«ntAd¦«‚|} | || ¦«}n#|d|¦«rÕtB ||¦«}|rq| "¦«dd…}| #|¦«| $¦«} |d| d z ¦«s| d z } | || ¦«}ŒÀd||d…vr9| |||dz…¦«| ||dz¦«}nI|d|¦«r5tJ ||¦«}|rj| "d ¦«}| &|¦«| $¦«} |d| d z ¦«s| d z } | || ¦«}Œ›tN ||¦«}|rX|rU| "¦«||d…kr5| $¦«} | |kr|} | ||d z¦«}n@|d z|kr/| d¦«| ||d z¦«}nn||k°I|rr||krl|jr2|jr+| t|||…¦«¦«n| |||…¦«| ||¦«}||d…|_dS)Nrú<ú&é"z[\t\n\r\f ;]zÒ>¸wÈÑOÔOð$áØAøàÔ(×/Ò/°¸Ñ;Ô;ØðØŸš™ œ AAà”ðÙØAØ1ŠuˆuØÔ(ð3¨T¬_ð3Ø×$Ò$¥X¨g°a¸°c¬lÑ%;Ô%;Ñ<Ô<Ð<Ð<à×$Ò$ W¨Q¨q¨S¤\Ñ2Ô2Ð2Ø—’˜q !Ñ$Ô$ˆAØAŠvˆv‘uØ Ô+ˆJØˆz˜#˜qÑ!Ô!ñ\ 6Ý×%Ò% g¨qÑ1Ô1ðØ×+Ò+¨AÑ.Ô.AAØZ aÑ(Ô(ðØ×)Ò)¨!Ñ,Ô,AAØZ ¨Ñ*Ô*ð Ø×*Ò*¨1Ñ-Ô-AAØZ aÑ(Ô(ðØŸ š aÑ(Ô(AAØZ aÑ(Ô(ðØ×3Ò3°AÑ6Ô6AAØ˜!‘e˜q’[[ C[Ø×$Ò$ SÑ)Ô)Ð)Ø˜A™AAáØq’5‘5ØðÙÝ#×)Ò)¨'°1Ñ5Ô5ðHÙØ#˜ D¨!Ñ,Ô,ðHØ˜q™5 Aš:˜:Ø ×,Ò,¨TÑ2Ô2Ð2Ñ2Ý'×-Ò-¨g°qÑ9Ô9ð?Ù ð!×/Ò/°¸¸!¹¸¸´ Ñ>Ô>Ð>Ñ>Ø#˜ F¨AÑ.Ô.ðHØ˜Ø&8ð&ð&˜FØ&×/Ò/°¸¸!¹Ñ<Ô<ð&Ø !¥S¨¡[¤[Ñ 0 Ø % ð&ð×+Ò+¨G°A°a±C¸°E¬NÑ;Ô;Ð;Ð;Ø#˜ K°Ñ3Ô3ð H¸Ô8Kð HØ×)Ò)¨'°!°A±#°$°$¬-Ñ8Ô8Ð8Ð8Ø 1 Q¡3 œ×-Ò-Ñ/Ô/°;Ò>Ð>Ø×(Ò(¨°°1±°°¬Ñ7Ô7Ð7Ð7Ø#˜ D¨!Ñ,Ô,ðHà×+Ò+¨G°A°a±C°D°D¬MÑ:Ô:Ð:Ð:Ø#˜ D¨!Ñ,Ô,ðHØŸš w¨q°©s¨t¨t¤}Ñ5Ô5Ð5Ð5å,Ð-FÑGÔGÐGØAØ—N’N 1 aÑ(Ô(‘Ø˜D !Ñ$Ô$ð+ 6ÝŸ š g¨qÑ1Ô1ØðØ Ÿ;š;™=œ=¨¨2¨Ô.DØ×'Ò'¨Ñ-Ô-Ð-ØŸ š ™œAØ%˜: c¨1¨Q©3Ñ/Ô/ð"Ø ™E˜ØŸš q¨!Ñ,Ô,AÙà˜g a b bœkÐ)Ð)Ø×(Ò(¨°°1°Q±3°¬Ñ8Ô8Ð8Ø ŸNšN¨1¨a°©cÑ2Ô2˜ÙØ˜C Ñ#Ô#ñ 6Ý!Ÿš¨°Ñ3Ô3ØðØ Ÿ;š; q™>œ>DØ×)Ò)¨$Ñ/Ô/Ð/ØŸ š ™œAØ%˜: c¨1¨Q©3Ñ/Ô/ð"Ø ™E˜ØŸš q¨!Ñ,Ô,AÙÝ"×(Ò(¨°!Ñ4Ô4Øðàð5˜uŸ{š{™}œ}°¸¸¸´Ò;Ð;Ø!ŸIšI™KœK˜Ø š6˜6Ø !˜AØ ŸNšN¨1¨a°!©eÑ4Ô4˜àØ˜!‘e˜q’[[ð×$Ò$ SÑ)Ô)Ð)ØŸš q¨!¨a©%Ñ0Ô0AAàðs!Še‰eðzð %1q’55ØÔ$ð /¨¬ð /Ø× Ò ¥¨'°!°A°#¬,Ñ!7Ô!7Ñ8Ô8Ð8Ð8à× Ò ¨¨1¨¤Ñ.Ô.Ð.Ø—’˜q !Ñ$Ô$ˆAØ˜q˜r˜r”{ˆŒˆˆrcó(—|j}|||dz…dkr| |¦«S|||dz…dkrM|jrF| d|dz¦«}|dkrdS| ||dz|…¦«|dzS|||dz… ¦«d krF| d |dz¦«}|dkrdS| ||dz|…¦«|dzS|||dz…d kry| d |dz¦«}|dkrdS||dz dkr$| ||dz|dz …¦«n | ||dz|…¦«|dzS| |¦«S)NrErBrHrFz]]>rrJrGrIrrCr)z˜VÒ#Ð#à×%Ò% aÑ(Ô(Ð(Ø Qq˜‘sUŒ^˜{Ò *Ð *¨tÔ/BÐ *Ø—’˜U A a¡CÑ(Ô(ˆAØ1ŠuˆuØrØ×Ò˜g a¨¡c¨1 fœoÑ.Ô.Ð.Øq‘5ˆLØ Qq˜‘sUŒ^× !Ò !Ñ #Ô # {Ò 2Ð 2à—L’L a¨¡cÑ*Ô*ˆEØ˜Š{ˆ{ØrØ×Ò˜W Q q¡S¨ YÔ/Ñ0Ô0Ð0Ø˜‘7ˆNØ Qq˜‘sUŒ^˜uÒ $Ð $Ø—’˜S ! A¡#Ñ&Ô&ˆAØ1ŠuˆuØrØq˜‘sŒ|˜sÒ"Ð"Ø×!Ò! '¨!¨A©#¨q°©s¨(Ô"3Ñ4Ô4Ð4Ð4à×#Ò# G¨A¨a©C°¨F¤OÑ4Ô4Ð4Øq‘5ˆLà×+Ò+¨AÑ.Ô.Ð.rcó(—|j}t ||dz¦«}|s"t ||dz¦«}|sdS|r4| ¦«}| ||dz|…¦«| ¦«S)NrErJ)rÚcommentcloserPÚcommentabruptcloserVrQr]rf)rrjÚreportrrVrls rrYzHTMLParser.parse_commentps“€Ø”,ˆå×#Ò# G¨Q¨q©SÑ1Ô1ˆØð Ý&×,Ò,¨W°a¸±cÑ:Ô:ˆEØð ØrØð 1Ø—’‘ ” ˆAØ×Ò ¨¨!©¨Q¨¤Ñ0Ô0Ð0ØyŠy‰{Œ{Ðrr)có —|j}| d|dz¦«}|dkrdS|r | ||dz|…¦«|dzS)NrrCrJr))rrMr])rrjrxrÚposs rrszHTMLParser.parse_bogus_commentsb€Ø”,ˆðlŠl˜3 !¡Ñ$Ô$ˆØ"Š9ˆ9Ø2Øð 2Ø×Ò ¨¨!©¨C¨Ô 0Ñ1Ô1Ð1ØQ‰wˆrcóè—|j}t ||dz¦«}|sdS| ¦«}| ||dz|…¦«| ¦«}|S)NrCrJ)rÚpicloserPrQrarf©rrjrrVrls rrZzHTMLParser.parse_pi‹sj€Ø”,ˆå—’˜w¨¨!©Ñ,Ô,ˆØð Ø2ØKŠK‰MŒMˆØŠw˜q ™s A˜v”Ñ'Ô'Ð'ØIŠI‰KŒKˆØˆrcóª—d|_| |¦«}|dkr|S|j}|||…|_g}t ||dz¦«}| ¦«}| d¦« ¦«x|_}||krÛt ||¦«}|sn½| ddd¦«\} } }| sd}nI|dd…dcxkr|dd…ks"n|dd…dcxkr|dd…kr nn |dd…}|rt|¦«}| | ¦«|f¦«| ¦«}||k°Û|||… ¦«}|dvr| |||…¦«|S| d ¦«r| ||¦«nj| ||¦«||jvs|jr|d ks|dkr| |d¬ ¦«n ||jvr| |d¬ ¦«|S)Nrr)rCrGú'rJú")rú/>rÚnoscriptr1Fr.T)r,Úcheck_for_whole_start_tagrÚtagfind_tolerantrVrfrdr2rÚattrfind_tolerantrÚappendÚstriprRr^Úhandle_startendtagÚhandle_starttagÚCDATA_CONTENT_ELEMENTSrr8ÚRCDATA_CONTENT_ELEMENTS) rrjÚendposrÚattrsrVrnÚtagÚmÚattrnameÚrestÚ attrvaluerfs rrWzHTMLParser.parse_starttag—s¦€ð $ˆÔØ×/Ò/°Ñ2Ô2ˆØAŠ:ˆ:ØˆMØ”,ˆØ& q¨ xÔ0ˆÔðˆÝ ×&Ò& w°°!±Ñ4Ô4ˆàIŠI‰KŒKˆØ"Ÿ[š[¨™^œ^×1Ò1Ñ3Ô3Ð3ˆŒsØ&ŠjˆjÝ!×'Ò'¨°Ñ3Ô3ˆAØð ØØ()¯ª°°1°aÑ(8Ô(8Ñ%ˆHd˜IØð ,Ø Ø˜2˜A˜2” $Ð8Ð8Ò8Ð8¨)°B°C°C¬.Ò8Ð8Ð8Ð8Ø˜2˜A˜2” #Ð7Ð7Ò7Ð7¨°2°3°3¬Ò7Ð7Ð7Ð7Ð7Ø% a¨ dœO Øð 0Ý$ YÑ/Ô/ ØLŠL˜(Ÿ.š.Ñ*Ô*¨IÐ6Ñ7Ô7Ð7Ø—’‘”ˆAð&Šjˆjða˜hÔ×%Ò%Ñ'Ô'ˆØkÐ!Ð!Ø×Ò˜W Q v XÔ.Ñ/Ô/Ð/ØˆMØ<Š<˜ÑÔð 9à×#Ò# C¨Ñ/Ô/Ð/Ð/à× Ò eÑ,Ô,Ð,ØtÔ2Ð2Ð2Ø”ð3Ø$'¨:Ò$5Ð$5Ø{Ò"Ð"Ø×#Ò# C°5Ð#Ñ9Ô9Ð9Ð9Ø˜Ô4Ð4Ð4Ø×#Ò# C°4Ð#Ñ8Ô8Ð8Øˆ rcóš—|j}t ||dz¦«}| ¦«}||dz dkrdS|S)Nr)rrJ)rÚlocatetagendrVrfr}s rrƒz$HTMLParser.check_for_whole_start_tagÉsL€Ø”,ˆÝ×"Ò" 7¨A¨a©CÑ0Ô0ˆàIŠI‰KŒKˆØ1Q‘3Œ<˜3ÒÐØ2ØˆrcóF—|j}| d|dz¦«dkrdSt ||¦«s.||dz|dz…dkr|dzS| |¦«St ||dz¦«}| ¦«}||dz dkrdSt ||dz¦«}| d¦« ¦«}| |¦«| ¦«|S)NrrCrrJrGr))rrMr\rVrsr”rfr„rdr2Ú handle_endtagr:)rrjrrVrlrŽs rrXzHTMLParser.parse_endtagÓs€ð”,ˆà<Š<˜˜Q˜q™SÑ!Ô! AÒ%Ð%Ø2Ý×Ò ¨Ñ+Ô+ð 3Øq˜‘s˜1˜Q™3wÔ 3Ò&Ð&à˜‘s à×/Ò/°Ñ2Ô2Ð2å×"Ò" 7¨A¨a©CÑ0Ô0ˆàIŠI‰KŒKˆØ1Q‘3Œ<˜3ÒÐØ2õ!×&Ò& w°°!±Ñ4Ô4ˆàkŠk˜!‰nŒn×"Ò"Ñ$Ô$ˆØ×Ò˜3ÑÔÐØ×ÒÑÔÐØˆrcó\—| ||¦«| |¦«dS©N)r‰r–©rrŽrs rrˆzHTMLParser.handle_startendtagñs2€Ø×Ò˜S %Ñ(Ô(Ð(Ø×Ò˜3ÑÔÐÐÐrcó—dSr˜©r™s rr‰zHTMLParser.handle_starttagöó€Øˆrcó—dSr˜r›)rrŽs rr–zHTMLParser.handle_endtagúrœrcó—dSr˜r›©rrps rrezHTMLParser.handle_charrefþrœrcó—dSr˜r›rŸs rrhzHTMLParser.handle_entityrefrœrcó—dSr˜r›r%s rrRzHTMLParser.handle_datarœrcó—dSr˜r›r%s rr]zHTMLParser.handle_comment rœrcó—dSr˜r›)rÚdecls rr`zHTMLParser.handle_declrœrcó—dSr˜r›r%s rrazHTMLParser.handle_pirœrcó—dSr˜r›r%s rr_zHTMLParser.unknown_declrœr)T)r))!Ú__name__Ú __module__Ú__qualname__Ú__doc__rŠr‹rrr'r*r,r-r8r:r=r$r[rYrsrZrWrƒrXrˆr‰r–rerhrRr]r`rar_r›rrrrZsò€€€€€ððð0YÐØ3Ðà+/¸5ðððððð+ð+ð+ððððððð€Oð$ð$ð$ð16ð Bð Bð Bð Bð Bðððð #ð#ð#ð#ð G#ðG#ðG#ðX/ð/ð/ðDðððð ð ð ð ð ð ð ð.ð.ð.ðdðððððð< ð ð ð ð ð ð ð ð ð ð ð ð ð ð ð ð ð ð ð ð ð ð ð ð ð ð ð ð ð ð ð r)rªr3r ÚhtmlrÚ__all__r4rrirgrcrUr\r|rvrwr„ÚVERBOSEr…r”Úlocatestarttagend_tolerantÚ endendtagÚ endtagfindr!rr›rrúr±s¶ðØ"Ð"ð € € € ØÐÐÐàÐÐÐÐÐðˆ.€ð R”Z Ñ'Ô'ÐØ ˆRŒZ˜Ñ %Ô %€ àˆBŒJÐ>Ñ?Ô?€ Ø ˆ"Œ*Ð@Ñ AÔ A€àˆrŒz˜+Ñ&Ô&€Ø ˆRŒZ˜Ñ %Ô %€ Ø ˆ"Œ*S‰/Œ/€ØˆrŒz˜(Ñ#Ô#€ØR”Z Ñ'Ô'Ðð2”:ÐQÑRÔRÐØB”Jð ð„ZñôÐðˆrŒzð ð„Zñ ô €ð (˜RœZð)ð„ZñôÐð ˆBŒJs‰OŒO€ Ø ˆRŒZÐ>Ñ ?Ô ?€ ð| ð| ð| ð| ð| Ô'ñ| ô| ð| ð| ð| r