Utilisez des expressions régulières dans asp pour effacer le format Word du contenu copié et collé dans l'éditeur d'arrière-plan et le convertir en texte brut. Lorsque les clients de l'entreprise utilisent l'édition en arrière-plan du site Web pour ajouter et modifier du contenu, ils copient souvent le contenu directement du document Word vers. l'éditeur. Il suffit de soumettre. Le résultat est qu'il existe une variété de styles sur la page d'affichage du contenu, et parfois du contenu en texte brut est nécessaire sous forme d'extraits, ce qui nécessite tous d'effacer le format Word. Il est difficile de changer les habitudes du client en lui demandant de le copier dans le Bloc-notes puis de le coller dans l'éditeur pour le modifier, nous commençons donc par le modifier nous-mêmes. J'ai trouvé quelques règles régulières pour effacer les formats de mots de Baidu sur Internet, mais les résultats n'étaient pas satisfaisants, j'ai donc écrit une fonction asp pour effacer moi-même les formats de mots, qui peut répondre à nos propres besoins. La fonction est la suivante :
Copiez le code comme suit :
fonction cleanWord (html)
dimregEx
set regEx = Nouvelle RegExp
regEx.IgnoreCase=True
regEx.Global=Vrai
regEx.Pattern=<[^>]*> 'Effacer tout le contenu entre <>
html = regEx.replace(html, )
regEx.Pattern={[^}]*} 'Effacer tout le contenu entre {}
html = regEx.replace(html, )
regEx.Pattern=/[^/]*/ 'Effacer tous les commentaires entre /**/
html = regEx.replace(html, )
html =Replace(html,table.MsoNormalTable,) 'Remplacer les mots manquants
mot propre=html
définir regEx = rien
fonction de fin