Schnelle Volltextsuche mit Solr

Wann immer größere Datenbestände effektiv durchsucht werden müssen, stößt man mit relationalen Datenbanksystemen schnell an die Grenzen. Spätestens wenn bestimmte Begriffe stärker gewichtet oder auf andere umgeleitet werden müssen, wird die Formulierung einer entsprechenden Abfrage eine eigene, nicht triviale Wissenschaft. Meistens gestalten sich diese Abfragen komplex, sodass sie bei einem großen Datenbestand in der Folge nicht performant sind.
Dokumentenbasierte Indexe eignen sich besser für das Durchsuchen großer Datenbestände. Sie bieten spezielle Werkzeuge, um eine Treffermenge zu definieren und auch, um sie nach eigenen Regeln zu wichten. In diesem Artikel möchte ich eine Umsetzungsmöglichkeit mit Solr zeigen. Weiterlesen

Creating coding standards for PHP_CodeSniffer

When our project is supervised by a continous integration platform, we are (hopefully) using static code analysis tools. One of the best for analysing PHP code
is PHP_CodeSniffer which integrates fine into systems like PhpUnderControl, Hudson or Bamboo. But in some cases the pre-installed coding standards like PEAR or Zend might not be sufficient for our
current project or we want to deviate. This is the moment when we want to be able to create a custom one that fits our special needs. In this article I want to share my first experiences
with you about how to create a custom coding standard for PHP_CodeSniffer.

Weiterlesen

Import and export data using PHPExcel

There’s a newer version of this article topic available (2014). Please read on at Performant handling of Excel files in PHP.
A few weeks ago I had to read and write Excel files of the format BIFF8 (Excel 97), because the customer did not accept the workaround of exporting data to CSV. PEAR’s Spreadsheet_Excel_Writer combined with the project Spreadsheet_Excel_Reader on SourceForge was a good helper in the past – but only for BIFF5. BIFF8 support in spreadsheet excel writer has been a problem for a long time, and according to the authors, is still somewhat kludgy in the current version. So I needed an alternative.After a short research I stumbled upon PHPExcel which supports reading and writing of many formats in one API. It is released under the GNU Lesser General Public License which gives you the freedom to use it in commercial applications.
Output and input formats are not limited to Excel files. This article gives you a short overview about what you can do with it and demonstrates the basic usage. Weiterlesen