pelican-theme/pelican/readers.py

from docutils import core
from markdown import Markdown
import re
import string

# import the directives to have pygments support
import rstdirectives

from pelican.utils import get_date, open


_METADATAS_PROCESSORS = {
    'tags': lambda x: map(string.strip, x.split(',')),
    'date': lambda x: get_date(x),
    'status': string.strip,
}


class RstReader(object):

    def _parse_metadata(self, content):
        """Return the dict containing metadatas"""
        output = {}
        for m in re.compile('^:([a-z]+): (.*)\s', re.M).finditer(content):
            name, value = m.group(1).lower(), m.group(2)
            output[name] = _METADATAS_PROCESSORS.get(
                name, lambda x:x
            )(value)
        return output

    def read(self, filename):
        """Parse restructured text"""
        text = open(filename)
        metadatas = self._parse_metadata(text)
        extra_params = {'input_encoding': 'unicode',
                        'initial_header_level': '2'}
        rendered_content = core.publish_parts(text, writer_name='html',
                                              settings_overrides=extra_params)
        title = rendered_content.get('title')
        content = rendered_content.get('body')
        if not metadatas.has_key('title'):
            metadatas['title'] = title
        return content, metadatas

class MarkdownReader(object):

    def read(self, filename):
        """Parse content and metadata of markdown files"""
        text = open(filename)
        md = Markdown(extensions = ['meta', 'codehilite'])
        content = md.convert(text)
        
        metadatas = {}
        for name, value in md.Meta.items():
            name = name.lower()
            metadatas[name] = _METADATAS_PROCESSORS.get(
                name, lambda x:x
            )(value[0])
        return content, metadatas

_EXTENSIONS = {'rst': RstReader, 'md': MarkdownReader}  # supported formats


def read_file(filename, fmt=None):
    """Return a reader object using the given format."""
    if not fmt:
        fmt = filename.split('.')[-1]
    if fmt not in _EXTENSIONS.keys():
        raise TypeError('Pelican does not know how to parse %s' % filename)
    reader = _EXTENSIONS[fmt]()
    return reader.read(filename)
Welcome Pelican 2.0 ! Refactoring of the internals to be more extensible. --HG-- rename : pelican/bloggenerator.py => pelican/generators.py 2010-10-30 00:56:40 +01:00			`from docutils import core`
Add the ability to read from markdown too. 2010-10-31 00:08:16 +01:00			`from markdown import Markdown`
Welcome Pelican 2.0 ! Refactoring of the internals to be more extensible. --HG-- rename : pelican/bloggenerator.py => pelican/generators.py 2010-10-30 00:56:40 +01:00			`import re`
Fixed tags parsing, now it can parse tags like this "blah,minor, foo , bar". Also, code for metadata parsing was slightly refactored. 2010-12-22 01:08:23 +03:00			`import string`
Welcome Pelican 2.0 ! Refactoring of the internals to be more extensible. --HG-- rename : pelican/bloggenerator.py => pelican/generators.py 2010-10-30 00:56:40 +01:00
			`# import the directives to have pygments support`
			`import rstdirectives`

			`from pelican.utils import get_date, open`


Fixed tags parsing, now it can parse tags like this "blah,minor, foo , bar". Also, code for metadata parsing was slightly refactored. 2010-12-22 01:08:23 +03:00			`_METADATAS_PROCESSORS = {`
			`'tags': lambda x: map(string.strip, x.split(',')),`
			`'date': lambda x: get_date(x),`
			`'status': string.strip,`
			`}`
Welcome Pelican 2.0 ! Refactoring of the internals to be more extensible. --HG-- rename : pelican/bloggenerator.py => pelican/generators.py 2010-10-30 00:56:40 +01:00

			`class RstReader(object):`

			`def _parse_metadata(self, content):`
			`"""Return the dict containing metadatas"""`
			`output = {}`
Fixed tags parsing, now it can parse tags like this "blah,minor, foo , bar". Also, code for metadata parsing was slightly refactored. 2010-12-22 01:08:23 +03:00			`for m in re.compile('^:([a-z]+): (.*)\s', re.M).finditer(content):`
Welcome Pelican 2.0 ! Refactoring of the internals to be more extensible. --HG-- rename : pelican/bloggenerator.py => pelican/generators.py 2010-10-30 00:56:40 +01:00			`name, value = m.group(1).lower(), m.group(2)`
Fixed tags parsing, now it can parse tags like this "blah,minor, foo , bar". Also, code for metadata parsing was slightly refactored. 2010-12-22 01:08:23 +03:00			`output[name] = _METADATAS_PROCESSORS.get(`
			`name, lambda x:x`
			`)(value)`
Welcome Pelican 2.0 ! Refactoring of the internals to be more extensible. --HG-- rename : pelican/bloggenerator.py => pelican/generators.py 2010-10-30 00:56:40 +01:00			`return output`

			`def read(self, filename):`
			`"""Parse restructured text"""`
			`text = open(filename)`
			`metadatas = self._parse_metadata(text)`
			`extra_params = {'input_encoding': 'unicode',`
			`'initial_header_level': '2'}`
			`rendered_content = core.publish_parts(text, writer_name='html',`
			`settings_overrides=extra_params)`
			`title = rendered_content.get('title')`
			`content = rendered_content.get('body')`
			`if not metadatas.has_key('title'):`
			`metadatas['title'] = title`
			`return content, metadatas`

Add the ability to read from markdown too. 2010-10-31 00:08:16 +01:00			`class MarkdownReader(object):`

			`def read(self, filename):`
			`"""Parse content and metadata of markdown files"""`
			`text = open(filename)`
Add syntax highlight support for markdown posts 2010-11-24 15:49:10 +01:00			`md = Markdown(extensions = ['meta', 'codehilite'])`
Add the ability to read from markdown too. 2010-10-31 00:08:16 +01:00			`content = md.convert(text)`

			`metadatas = {}`
			`for name, value in md.Meta.items():`
Lowercase meta field's name before looking the processor. 2010-12-17 00:04:45 +03:00			`name = name.lower()`
Fixed tags parsing, now it can parse tags like this "blah,minor, foo , bar". Also, code for metadata parsing was slightly refactored. 2010-12-22 01:08:23 +03:00			`metadatas[name] = _METADATAS_PROCESSORS.get(`
Simplier metadata processing, using dict's 'get' method with default value. 2010-12-17 00:07:55 +03:00			`name, lambda x:x`
			`)(value[0])`
Add the ability to read from markdown too. 2010-10-31 00:08:16 +01:00			`return content, metadatas`

			`_EXTENSIONS = {'rst': RstReader, 'md': MarkdownReader} # supported formats`
Welcome Pelican 2.0 ! Refactoring of the internals to be more extensible. --HG-- rename : pelican/bloggenerator.py => pelican/generators.py 2010-10-30 00:56:40 +01:00

			`def read_file(filename, fmt=None):`
			`"""Return a reader object using the given format."""`
			`if not fmt:`
Add the ability to read from markdown too. 2010-10-31 00:08:16 +01:00			`fmt = filename.split('.')[-1]`
Welcome Pelican 2.0 ! Refactoring of the internals to be more extensible. --HG-- rename : pelican/bloggenerator.py => pelican/generators.py 2010-10-30 00:56:40 +01:00			`if fmt not in _EXTENSIONS.keys():`
Add the ability to read from markdown too. 2010-10-31 00:08:16 +01:00			`raise TypeError('Pelican does not know how to parse %s' % filename)`
Welcome Pelican 2.0 ! Refactoring of the internals to be more extensible. --HG-- rename : pelican/bloggenerator.py => pelican/generators.py 2010-10-30 00:56:40 +01:00			`reader = _EXTENSIONS[fmt]()`
			`return reader.read(filename)`