From 92c6384fc96695bef2de3dd046598f21df3f8819 Mon Sep 17 00:00:00 2001
From: =?UTF-8?q?Jes=C3=BAs=20Fern=C3=A1ndez?= <fernandez.cuesta@gmail.com>
Date: Wed, 20 May 2015 10:44:44 +0200
Subject: [PATCH 1/4] Remove duplicate tags

---
 pelican/readers.py | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/pelican/readers.py b/pelican/readers.py
index 3656cd96..8c9ff38b 100644
--- a/pelican/readers.py
+++ b/pelican/readers.py
@@ -50,7 +50,7 @@ def _process_if_nonempty(processor, name, settings):
 
 
 METADATA_PROCESSORS = {
-    'tags': lambda x, y: [Tag(tag, y) for tag in strip_split(x)] or _DISCARD,
+    'tags': lambda x, y: set(Tag(tag, y) for tag in strip_split(x) if tag) or _DISCARD,
     'date': lambda x, y: get_date(x.replace('_', ' ')),
     'modified': lambda x, y: get_date(x),
     'status': lambda x, y: x.strip() or _DISCARD,

From 48f1d5c9607558f6bfeee88302952ec40d947a85 Mon Sep 17 00:00:00 2001
From: =?UTF-8?q?Jes=C3=BAs=20Fern=C3=A1ndez?= <fernandez.cuesta@gmail.com>
Date: Wed, 20 May 2015 15:55:21 +0200
Subject: [PATCH 2/4] Fix duplicates in `strip_split`

---
 pelican/readers.py | 4 ++--
 1 file changed, 2 insertions(+), 2 deletions(-)

diff --git a/pelican/readers.py b/pelican/readers.py
index 8c9ff38b..103b7837 100644
--- a/pelican/readers.py
+++ b/pelican/readers.py
@@ -31,7 +31,7 @@ from pelican.utils import get_date, pelican_open, FileStampDataCacher, SafeDatet
 def strip_split(text, sep=','):
     """Return a list of stripped, non-empty substrings, delimited by sep."""
     items = [x.strip() for x in text.split(sep)]
-    return [x for x in items if x]
+    return list(set([x for x in items if x]))
 
 
 # Metadata processors have no way to discard an unwanted value, so we have
@@ -50,7 +50,7 @@ def _process_if_nonempty(processor, name, settings):
 
 
 METADATA_PROCESSORS = {
-    'tags': lambda x, y: set(Tag(tag, y) for tag in strip_split(x) if tag) or _DISCARD,
+    'tags': lambda x, y: [Tag(tag, y) for tag in strip_split(x)] or _DISCARD,
     'date': lambda x, y: get_date(x.replace('_', ' ')),
     'modified': lambda x, y: get_date(x),
     'status': lambda x, y: x.strip() or _DISCARD,

From aa267b047a18c44eec8a268776836422799ca647 Mon Sep 17 00:00:00 2001
From: =?UTF-8?q?Jes=C3=BAs=20Fern=C3=A1ndez?= <fernandez.cuesta@gmail.com>
Date: Wed, 20 May 2015 21:46:18 +0200
Subject: [PATCH 3/4] Use ordereddict instead of set

---
 pelican/readers.py | 4 ++--
 1 file changed, 2 insertions(+), 2 deletions(-)

diff --git a/pelican/readers.py b/pelican/readers.py
index 103b7837..6905cf4a 100644
--- a/pelican/readers.py
+++ b/pelican/readers.py
@@ -26,12 +26,12 @@ from six.moves.html_parser import HTMLParser
 from pelican import signals
 from pelican.contents import Page, Category, Tag, Author
 from pelican.utils import get_date, pelican_open, FileStampDataCacher, SafeDatetime, posixize_path
-
+from collections import OrderedDict
 
 def strip_split(text, sep=','):
     """Return a list of stripped, non-empty substrings, delimited by sep."""
     items = [x.strip() for x in text.split(sep)]
-    return list(set([x for x in items if x]))
+    return list(OrderedDict.fromkeys([x for x in items if x]))
 
 
 # Metadata processors have no way to discard an unwanted value, so we have

From 1131887790cdd86642bfa7e70877b0f79ed40d7e Mon Sep 17 00:00:00 2001
From: =?UTF-8?q?Jes=C3=BAs=20Fern=C3=A1ndez?= <fernandez.cuesta@gmail.com>
Date: Fri, 29 May 2015 17:23:23 +0200
Subject: [PATCH 4/4] Remove duplicate tags, fix styling warnings as per flake8

---
 pelican/readers.py | 29 ++++++++++++++++++-----------
 1 file changed, 18 insertions(+), 11 deletions(-)

diff --git a/pelican/readers.py b/pelican/readers.py
index 6905cf4a..0ced68b9 100644
--- a/pelican/readers.py
+++ b/pelican/readers.py
@@ -25,9 +25,11 @@ from six.moves.html_parser import HTMLParser
 
 from pelican import signals
 from pelican.contents import Page, Category, Tag, Author
-from pelican.utils import get_date, pelican_open, FileStampDataCacher, SafeDatetime, posixize_path
+from pelican.utils import (get_date, pelican_open, FileStampDataCacher,
+                           SafeDatetime, posixize_path)
 from collections import OrderedDict
 
+
 def strip_split(text, sep=','):
     """Return a list of stripped, non-empty substrings, delimited by sep."""
     items = [x.strip() for x in text.split(sep)]
@@ -68,6 +70,7 @@ def _filter_discardable_metadata(metadata):
 
 logger = logging.getLogger(__name__)
 
+
 class BaseReader(object):
     """Base class to read files.
 
@@ -179,7 +182,7 @@ class RstReader(BaseReader):
                 elif element.tagname == 'authors':  # author list
                     name = element.tagname
                     value = [element.astext() for element in element.children]
-                    value = ','.join(value) # METADATA_PROCESSORS expects a string
+                    value = ','.join(value)  # METADATA_PROCESSORS expects str
                 else:  # standard fields (e.g. address)
                     name = element.tagname
                     value = element.astext()
@@ -251,7 +254,8 @@ class MarkdownReader(BaseReader):
             elif name in METADATA_PROCESSORS:
                 if len(value) > 1:
                     logger.warning('Duplicate definition of `%s` '
-                        'for %s. Using first one.', name, self._source_path)
+                                   'for %s. Using first one.',
+                                   name, self._source_path)
                 output[name] = self.process_metadata(name, value[0])
             elif len(value) > 1:
                 # handle list metadata as list of string
@@ -363,7 +367,8 @@ class HTMLReader(BaseReader):
         def _handle_meta_tag(self, attrs):
             name = self._attr_value(attrs, 'name')
             if name is None:
-                attr_serialized = ', '.join(['{}="{}"'.format(k, v) for k, v in attrs])
+                attr_serialized = ', '.join(['{}="{}"'.format(k, v)
+                                             for k, v in attrs])
                 logger.warning("Meta tag in file %s does not have a 'name' "
                                "attribute, skipping. Attributes: %s",
                                self._filename, attr_serialized)
@@ -378,8 +383,8 @@ class HTMLReader(BaseReader):
                         " be changed to 'content'",
                         self._filename,
                         extra={'limit_msg': ("Other files have meta tag "
-                                             "attribute 'contents' that should "
-                                             "be changed to 'content'")})
+                                             "attribute 'contents' that should"
+                                             " be changed to 'content'")})
 
             if name == 'keywords':
                 name = 'tags'
@@ -458,7 +463,7 @@ class Readers(FileStampDataCacher):
         path = os.path.abspath(os.path.join(base_path, path))
         source_path = posixize_path(os.path.relpath(path, base_path))
         logger.debug('Read file %s -> %s',
-            source_path, content_class.__name__)
+                     source_path, content_class.__name__)
 
         if not fmt:
             _, ext = os.path.splitext(os.path.basename(path))
@@ -470,7 +475,7 @@ class Readers(FileStampDataCacher):
 
         if preread_signal:
             logger.debug('Signal %s.send(%s)',
-                preread_signal.name, preread_sender)
+                         preread_signal.name, preread_sender)
             preread_signal.send(preread_sender)
 
         reader = self.readers[fmt]
@@ -510,7 +515,8 @@ class Readers(FileStampDataCacher):
             def typogrify_wrapper(text):
                 """Ensures ignore_tags feature is backward compatible"""
                 try:
-                    return typogrify(text, self.settings['TYPOGRIFY_IGNORE_TAGS'])
+                    return typogrify(text,
+                                     self.settings['TYPOGRIFY_IGNORE_TAGS'])
                 except TypeError:
                     return typogrify(text)
 
@@ -523,7 +529,7 @@ class Readers(FileStampDataCacher):
 
         if context_signal:
             logger.debug('Signal %s.send(%s, <metadata>)',
-                context_signal.name, context_sender)
+                         context_signal.name, context_sender)
             context_signal.send(context_sender, metadata=metadata)
 
         return content_class(content=content, metadata=metadata,
@@ -574,7 +580,8 @@ def default_metadata(settings=None, process=None):
             if process:
                 value = process('category', value)
             metadata['category'] = value
-        if settings.get('DEFAULT_DATE', None) and settings['DEFAULT_DATE'] != 'fs':
+        if settings.get('DEFAULT_DATE',
+                        None) and settings['DEFAULT_DATE'] != 'fs':
             metadata['date'] = SafeDatetime(*settings['DEFAULT_DATE'])
     return metadata